Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/80037
Título: | Identificação de delirium em contexto hospitalar através de algoritmos de machine learning |
Outro(s) título(s): | Detection of delirium in healthcare settings through machine learning algorithms |
Autor(es): | Figueiredo, Célia Natália Lemos |
Orientador(es): | Braga, A. C. Mariz, José |
Palavras-chave: | Delirium Machine learning Random forest Regressão logística Logistic regression |
Data: | 12-Mai-2022 |
Resumo(s): | O aumento da esperança média de vida embora seja um indicador da melhoria da qualidade de
vida, está também associado a um acréscimo de doenças crónicas. Em virtude das múltiplas alterações
fisiológicas que caracterizam o indivíduo idoso é de esperar que este grupo etário seja particularmente
vulnerável aos efeitos adversos da hospitalização. Pequenas alterações causadas pela mudança do
estado de doença podem promover estados de confusão e desorientação nestes indivíduos. O delirium
é uma manifestação comum de disfunção neuropsiquiátrica aguda grave, muito prevalente em ambiente
hospitalar, que devido à sua variabilidade de apresentação clínica é frequentemente subdiagnosticado e
negligenciado. Neste contexto, surgiu o tema desta dissertação, cujo objetivo se centrou no
desenvolvimento de um modelo capaz de prever a ocorrência ou não de delirium. Para tal, foi usada a
linguagem Python e uma base de dados recolhida num hospital português entre 2014 e 2016. O modelo
desenvolvido foi implementado numa aplicação web, disponível através da seguinte hiperligação:
https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. Foram testados algoritmos de
machine learning (ML), nomeadamente os algoritmos Random Forest (RF) e regressão logística (RL). A
modelação iniciou-se com uma limpeza da base de dados, eliminando as variáveis e registos que não
possuíam informações relevantes para a previsão de delirium. De seguida, executou-se uma
transformação de dados que incluiu um agrupamento de medicamentos por grupo farmacológico e uma
transformação dos dados categóricos. A seleção de variáveis foi realizada através do método wrapper,
no qual foram testados os métodos Sequential Feature Selector (SFS), Recursive Feature Elimination
(RFE) e Select From Model (SFM). Dos modelos estudados, verificou-se o algoritmo de classificação RL
com o método de seleção de variáveis SFM foi o que apresentou melhores resultados nas métricas de
avaliação do modelo. Obtendo-se como resultados um modelo com 36 variáveis, a área abaixo da curva
ROC (AUC-ROC) de 0,833 e a área abaixo da curva precision-recall (AUC-PR) de 0,582.
Conclui-se que a idade, os antipsicóticos e a glicose demonstraram-se mais relevantes para a
previsão do delirium. E, embora o modelo de previsão ainda possa ser melhorado, apresenta-se como
ferramenta interessante para o auxílio de diagnóstico de delirium em ambiente hospitalar. Increased life expectancy is an indicator of improved quality of life, but it is also associated with an increase in chronic diseases. Due to the multiple physiological changes that characterise the elderly, it is expected that this age group is particularly vulnerable to the adverse effects of hospitalisation. Small changes in the individual caused by the change of disease state may promote states of confusion and disorientation. Delirium is a common manifestation of severe acute neuropsychiatric dysfunction, prevalent in hospital environment, which due to its variability of clinical presentation is often under diagnosed and neglected. In this sense, the topic of this dissertation emerged, whose purpose was focused on the development of a model capable of predicting the occurrence or not of delirium. To this end, Python language and a database collected in a Portuguese hospital between 2014 and 2016 were used. The developed model was implemented in a web application, available through the following link: https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. The machine learning algorithms tested were random forest and logistic regression. Before pattern recognition process, the dataset was cleaned, features and records with no relevance for delirium prediction were eliminated. Then, a feature engineering was performed, which included grouping medicines by pharmacological group and transformation of categorical data to make it interpretable by machine learning algorithms. Feature selection was performed using wrapper method, in which the Sequential Feature Selector, Recursive Feature Elimination and Select From Model methods were tested. From the models studied, the logistic regression algorithm with the Select From Model feature selection method was the one that displayed best evaluation metrics. The outcome obtained was a 36 features model with an area under a receiver operating characteristic curve (AUC-ROC) of 0.833 and an area under curve precision-recall (AUC-PR) of 0.582. Based on the model selected, age, antipsychotics and glucose were shown to be relevant for delirium prediction. And, although the prediction model can still be improved, this approach might be a useful support tool to identify patients at increased risk of delirium in healthcare settings. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Engenharia de Sistemas |
URI: | https://hdl.handle.net/1822/80037 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DPS - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Celia Natalia Lemos Figueiredo.pdf | Dissertação de Mestrado | 3,71 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons