Deep Learning-based algorithm for violence detection in audio data

Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/83542

Registo completo

Campo DC	Valor	Idioma
dc.contributor.advisor	Shah, Vaibhav	por
dc.contributor.advisor	Pereira, José Luís	por
dc.contributor.author	Gomes, Eduardo Dias	por
dc.date.accessioned	2023-03-27T13:41:13Z	-
dc.date.available	2023-03-27T13:41:13Z	-
dc.date.issued	2022	-
dc.date.submitted	2022	-
dc.identifier.uri	https://hdl.handle.net/1822/83542	-
dc.description	Dissertação de mestrado integrado em Engineering and Management of Information Systems	por
dc.description.abstract	Currently, the mobility services industry lacks a component that guarantees the safety of both its drivers and customers, which is not in line with the constant evolution of the technological sector and the exponential increase of IoT devices capable of capturing data from both the external and internal environment of the vehicle. In this context, Bosch Car Multimedia introduced the RideCare project, which aims to monitor various data in real time from the vehicles of a mobility service provider's fleet, being the root where this dissertation is inserted. The present work aims to study and develop a Deep Learning-based algorithm capable of detecting violent scenarios only using audio data as its input. In the experimental phase of this project, the CRoss Industry Standard Process for Data Mining (CRISP-DM) methodology was implemented in order to ensure that all project requirements were met in the most efficient way. Special attention was given to the data preparation phase as well as the modeling phase to ensure greater accuracy in terms of classification capability. Subsequently, the models were trained in several test scenarios, composed of several different audio representations, allowing to carry out a comparative analysis in order to extract the most competent model, which is comprised by the MobileNet architecture using the Mel-frequency cepstral coefficients audio feature as input, being able to achieve an accuracy of 81%.	por
dc.description.abstract	Atualmente, a indústria de serviços de mobilidade carece de uma componente que garanta a segurança tanto dos seus condutores como dos seus clientes, o que é algo que não se alinha com a constante evolução do setor tecnológico e com o exponencial aumento de dispositivos IoT capazes de capturar dados tanto do meio externo como interno do veículo. Desta forma, a Bosch Car Multimedia introduziu o projeto RideCare que tem vista a monitorização de vários dados em tempo real dos veículos de uma frota dum prestador de serviços de mobilidade, sendo a raíz onde esta dissertação se enquadra. O presente trabalho tem como objetivo estudar e desenvolver um algoritmo baseado em Deep Learning capaz de detetar cenários violentos apenas usando dados de áudio como input. Na fase experimental deste projeto a metodologia CRoss Industry Standard Process for Data Mining (CRISP-DM) foi implementada no sentido de garantir que todos os requisitos do projeto fossem cumpridos da forma mais eficiente. Foi dada uma especial atenção à fase de preparação dos dados bem como a fase de modelação para certificar uma maior precisão a nível de capacidade de classificação. Posteriormente, os modelos foram treinados em vários cenários de teste, compostos por várias representações de áudio diferentes, permitindo fazer uma análise comparativa de modo a retirar o modelo mais competente, sendo este constituído pela arquitetura MobileNet utilizando como input o audio feature Mel-frequency cepstral coefficients, atingindo uma acuidade de 81%. Palavras chave: Classificação de eventos de audio; Deteção de violência	por
dc.language.iso	eng	por
dc.rights	openAccess	por
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	por
dc.subject	Audio event classification	por
dc.subject	Audio features	por
dc.subject	CRISP-DM	por
dc.subject	Deep learning	por
dc.subject	Violence detection	por
dc.subject	Classificação de eventos de audio	por
dc.subject	Deteção de violência	por
dc.title	Deep Learning-based algorithm for violence detection in audio data	por
dc.title.alternative	Algoritmo baseado em deep learning para deteção de violência em dados de áudio	por
dc.type	masterThesis	eng
dc.identifier.tid	203244710	por
thesis.degree.grantor	Universidade do Minho	por
sdum.degree.grade	18 valores	por
sdum.uoei	Escola de Engenharia	por
dc.subject.fos	Engenharia e Tecnologia::Outras Engenharias e Tecnologias	por
Aparece nas coleções:	BUM - Dissertações de Mestrado