Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/80745
Title: | Distributed deep learning for sleep apnea detection on ECG signals |
Author(s): | Machado, Ana Margarida da Silva |
Advisor(s): | Sousa, António Brito, Cláudia Vanessa Martins |
Keywords: | Deep learning Sleep apnea Distributed deep learning Electrocardiogram Apneia do sono Deep learning distribuído Electrocardiograma |
Issue date: | 3-Jan-2020 |
Abstract(s): | A huge amount of medical data is being generated each day, leaving the doctors unable
to analyze such volume and make a good diagnosis for the patient. The emergence of Big
Data frameworks for data analysis leverages the automatic analysis of healthcare data in a
faster and accurate manner, by scanning which information is relevant, and, consequently,
detecting diseases in earlier stages.
Nowadays, it is estimated that about 9% to 38% of the world’s population has sleep ap nea. Unawareness of the disease’s presence can lead to the development of cardiovascular
diseases, and consequently, death. The detection of sleep apnea syndrome through the tra ditional method, Polysomnography (PSG), becomes not only expensive but also inconvenient
for the patient. Therefore, systems based on Electrocardiogram (ECG) can improve the qua lity of a patient’s health by overcoming these inconveniences. This master thesis relies on
deep learning (DL) networks, such as convolutional and recurrent neural networks for sleep
apnea detection. The computational complexity of these models depends on its size, types
of layers and data. This complexity also increases the computation time of the training task
leading to several hours spent training on a single machine. For this work, we propose
a sleep apnea detection system based on ECGs, alongside with a distributed version of it,
which parallelizes the training computation, reducing the overall learning time, while not
compromising the model performance.
The results obtained for sleep apnea detection encourage the use of electrocardiograms
for the detection of this disease. Our model achieved a value of 93% of sensitivity on
the Physionet database, being the highest value compared to other studies described in
the literature. Besides this, on the distributed environment it was accomplished similar
output quality, reducing the training time by approximately 50%, from the centralized to
distributed learning.
The model was trained with the Sleep Heart Health Study (SHHS) data, achieving the highest
results compared to the work described in the literature that used the same dataset. In
comparison with the previous dataset, the model trained and tested with the SHHS was
not able to attain a similar quality output. However, this corroborates the large diversity of
the SHHS data. Moreover, when it was tested if this model could classify the Physionet data,
it achieved promising results of 73,7%, 73,8%, 68,3% and 63,5% of accuracy, sensitivity, F1-
score, and precision, respectively, which lead us to conclude that the SHHS trained model
could be able to generalize to new data. In addition to this, on the distributed environment it was achieved equal output perfor mance for SHHS, reducing the training time by approximately 90%. Diariamente são geradas grandes quantidades de dados, impossibilitando a sua análise em tempo real. Em particular, num ambiente hospitalar, os médicos foram perdendo a capacidade de analisar todos os dados relativos a um paciente, o que compromete o seu diagnóstico. As ferramentas de Big Data vieram colmatar esta falha, promovendo a análise de grandes quantidades de dados. Esta análise permite selecionar apenas a informação relevante, fazendo com que os dados realmente necessários sejam vistos pelos médicos de uma forma rápida, permitindo assim a deteção de doenças precocemente. Atualmente, estima-se que entre 9% a 38% da população mundial tenha apneia do sono. O não diagnóstico desta doença pode levar ao desenvolvimento de doenças cardiovasculares e, consequentemente, à morte. A deteção desta síndrome pelo método tradicional, Polissonografia (PSG), torna-se não só dispendiosa, mas também inconveniente para o paciente. Com isto, o desenvolvimento de sistemas menos invasivos baseados em electrocardiogramas (ECG) podem melhorar a qualidade de vida do paciente, ultrapassando estes inconvenientes. Tendo por base estas afirmações, o objetivo principal desta dissertação assenta na criação e no estudo de modelos de Deep Learning (DL) para a deteção do síndrome da apneia do sono. Para isto, foram construídos três modelos distintos que assentam em camadas convolucionais e recorrentes. A complexidade computacional destes modelos depende não só do seu tamanho, mas também dos tipos de camada e dos dados. Esta complexidade faz com que haja um aumento no tempo de computação durante o treino dos modelos, sendo que em apenas uma máquina, este treino pode chegar a várias horas ou dias. Posto isto, foi desenvolvido um sistema de deteção de apneia do sono baseado em ECGs, juntamente com uma versão distribuída do mesmo, que paraleliza e reduz o tempo de treino. Os resultados obtidos mostraram-se promissores e salientam a importância do uso dos electrocardiogramas para a deteção da apneia do sono. Neste sentido, com os dados retirados do Physionet, o nosso modelo apresentou um valor de sensibilidade de 93%, sendo o valor mais alto comparado com outras alternativas propostas pelo estado da arte. Alem disso, no ambiente distribuído foram alcançados valores semelhantes de desempenho, reduzindo o tempo de treino em aproximadamente 50% comparativamente ao ambiente centralizado (apenas uma máquina). Para além do Physionet database, o modelo foi também treinado com os dados do Sleep Heart Health Study (SHHS), obtendo melhores resultados que os descritos na literatura. Em comparação com os dados anteriores, este último obteve resultados menos satisfatórios o que e corroborado pela a grande diversidade de patologias presentes nos dados. Além disso, após testar este modelo com os dados do Physionet, foram alcançados resultados auspiciosos de 73,7 %, 73,8 %, 68,3 % e 63,5 % de exatidão, sensibilidade, F1-score e precisão, respetivamente, o que nos leva a concluir que o modelo treinado do SHHS pode generalizar para dados que nunca viu. Além disso, no ambiente distribuído, foram alcançados valores similares de desempenho face ao ambiente centralizado, reduzindo, aproximadamente, 90% do tempo de treino. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Engenharia Biomédica |
URI: | https://hdl.handle.net/1822/80745 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Ana Margarida da Silva Machado.pdf | 2,95 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License