Distributed deep learning for sleep apnea detection on ECG signals

Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/80745

Título:	Distributed deep learning for sleep apnea detection on ECG signals
Autor(es):	Machado, Ana Margarida da Silva
Orientador(es):	Sousa, António Brito, Cláudia Vanessa Martins
Palavras-chave:	Deep learning Sleep apnea Distributed deep learning Electrocardiogram Apneia do sono Deep learning distribuído Electrocardiograma
Data:	3-Jan-2020
Resumo(s):	A huge amount of medical data is being generated each day, leaving the doctors unable to analyze such volume and make a good diagnosis for the patient. The emergence of Big Data frameworks for data analysis leverages the automatic analysis of healthcare data in a faster and accurate manner, by scanning which information is relevant, and, consequently, detecting diseases in earlier stages. Nowadays, it is estimated that about 9% to 38% of the world’s population has sleep ap nea. Unawareness of the disease’s presence can lead to the development of cardiovascular diseases, and consequently, death. The detection of sleep apnea syndrome through the tra ditional method, Polysomnography (PSG), becomes not only expensive but also inconvenient for the patient. Therefore, systems based on Electrocardiogram (ECG) can improve the qua lity of a patient’s health by overcoming these inconveniences. This master thesis relies on deep learning (DL) networks, such as convolutional and recurrent neural networks for sleep apnea detection. The computational complexity of these models depends on its size, types of layers and data. This complexity also increases the computation time of the training task leading to several hours spent training on a single machine. For this work, we propose a sleep apnea detection system based on ECGs, alongside with a distributed version of it, which parallelizes the training computation, reducing the overall learning time, while not compromising the model performance. The results obtained for sleep apnea detection encourage the use of electrocardiograms for the detection of this disease. Our model achieved a value of 93% of sensitivity on the Physionet database, being the highest value compared to other studies described in the literature. Besides this, on the distributed environment it was accomplished similar output quality, reducing the training time by approximately 50%, from the centralized to distributed learning. The model was trained with the Sleep Heart Health Study (SHHS) data, achieving the highest results compared to the work described in the literature that used the same dataset. In comparison with the previous dataset, the model trained and tested with the SHHS was not able to attain a similar quality output. However, this corroborates the large diversity of the SHHS data. Moreover, when it was tested if this model could classify the Physionet data, it achieved promising results of 73,7%, 73,8%, 68,3% and 63,5% of accuracy, sensitivity, F1- score, and precision, respectively, which lead us to conclude that the SHHS trained model could be able to generalize to new data. In addition to this, on the distributed environment it was achieved equal output perfor mance for SHHS, reducing the training time by approximately 90%. Diariamente são geradas grandes quantidades de dados, impossibilitando a sua análise em tempo real. Em particular, num ambiente hospitalar, os médicos foram perdendo a capacidade de analisar todos os dados relativos a um paciente, o que compromete o seu diagnóstico. As ferramentas de Big Data vieram colmatar esta falha, promovendo a análise de grandes quantidades de dados. Esta análise permite selecionar apenas a informação relevante, fazendo com que os dados realmente necessários sejam vistos pelos médicos de uma forma rápida, permitindo assim a deteção de doenças precocemente. Atualmente, estima-se que entre 9% a 38% da população mundial tenha apneia do sono. O não diagnóstico desta doença pode levar ao desenvolvimento de doenças cardiovasculares e, consequentemente, à morte. A deteção desta síndrome pelo método tradicional, Polissonografia (PSG), torna-se não só dispendiosa, mas também inconveniente para o paciente. Com isto, o desenvolvimento de sistemas menos invasivos baseados em electrocardiogramas (ECG) podem melhorar a qualidade de vida do paciente, ultrapassando estes inconvenientes. Tendo por base estas afirmações, o objetivo principal desta dissertação assenta na criação e no estudo de modelos de Deep Learning (DL) para a deteção do síndrome da apneia do sono. Para isto, foram construídos três modelos distintos que assentam em camadas convolucionais e recorrentes. A complexidade computacional destes modelos depende não só do seu tamanho, mas também dos tipos de camada e dos dados. Esta complexidade faz com que haja um aumento no tempo de computação durante o treino dos modelos, sendo que em apenas uma máquina, este treino pode chegar a várias horas ou dias. Posto isto, foi desenvolvido um sistema de deteção de apneia do sono baseado em ECGs, juntamente com uma versão distribuída do mesmo, que paraleliza e reduz o tempo de treino. Os resultados obtidos mostraram-se promissores e salientam a importância do uso dos electrocardiogramas para a deteção da apneia do sono. Neste sentido, com os dados retirados do Physionet, o nosso modelo apresentou um valor de sensibilidade de 93%, sendo o valor mais alto comparado com outras alternativas propostas pelo estado da arte. Alem disso, no ambiente distribuído foram alcançados valores semelhantes de desempenho, reduzindo o tempo de treino em aproximadamente 50% comparativamente ao ambiente centralizado (apenas uma máquina). Para além do Physionet database, o modelo foi também treinado com os dados do Sleep Heart Health Study (SHHS), obtendo melhores resultados que os descritos na literatura. Em comparação com os dados anteriores, este último obteve resultados menos satisfatórios o que e corroborado pela a grande diversidade de patologias presentes nos dados. Além disso, após testar este modelo com os dados do Physionet, foram alcançados resultados auspiciosos de 73,7 %, 73,8 %, 68,3 % e 63,5 % de exatidão, sensibilidade, F1-score e precisão, respetivamente, o que nos leva a concluir que o modelo treinado do SHHS pode generalizar para dados que nunca viu. Além disso, no ambiente distribuído, foram alcançados valores similares de desempenho face ao ambiente centralizado, reduzindo, aproximadamente, 90% do tempo de treino.
Tipo:	Dissertação de mestrado
Descrição:	Dissertação de mestrado em Engenharia Biomédica
URI:	https://hdl.handle.net/1822/80745
Acesso:	Acesso aberto
Aparece nas coleções:	BUM - Dissertações de Mestrado DI - Dissertações de Mestrado