Identificação de delirium em contexto hospitalar  através de algoritmos de machine learning

Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/80037

Título:	Identificação de delirium em contexto hospitalar através de algoritmos de machine learning
Outro(s) título(s):	Detection of delirium in healthcare settings through machine learning algorithms
Autor(es):	Figueiredo, Célia Natália Lemos
Orientador(es):	Braga, A. C. Mariz, José
Palavras-chave:	Delirium Machine learning Random forest Regressão logística Logistic regression
Data:	12-Mai-2022
Resumo(s):	O aumento da esperança média de vida embora seja um indicador da melhoria da qualidade de vida, está também associado a um acréscimo de doenças crónicas. Em virtude das múltiplas alterações fisiológicas que caracterizam o indivíduo idoso é de esperar que este grupo etário seja particularmente vulnerável aos efeitos adversos da hospitalização. Pequenas alterações causadas pela mudança do estado de doença podem promover estados de confusão e desorientação nestes indivíduos. O delirium é uma manifestação comum de disfunção neuropsiquiátrica aguda grave, muito prevalente em ambiente hospitalar, que devido à sua variabilidade de apresentação clínica é frequentemente subdiagnosticado e negligenciado. Neste contexto, surgiu o tema desta dissertação, cujo objetivo se centrou no desenvolvimento de um modelo capaz de prever a ocorrência ou não de delirium. Para tal, foi usada a linguagem Python e uma base de dados recolhida num hospital português entre 2014 e 2016. O modelo desenvolvido foi implementado numa aplicação web, disponível através da seguinte hiperligação: https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. Foram testados algoritmos de machine learning (ML), nomeadamente os algoritmos Random Forest (RF) e regressão logística (RL). A modelação iniciou-se com uma limpeza da base de dados, eliminando as variáveis e registos que não possuíam informações relevantes para a previsão de delirium. De seguida, executou-se uma transformação de dados que incluiu um agrupamento de medicamentos por grupo farmacológico e uma transformação dos dados categóricos. A seleção de variáveis foi realizada através do método wrapper, no qual foram testados os métodos Sequential Feature Selector (SFS), Recursive Feature Elimination (RFE) e Select From Model (SFM). Dos modelos estudados, verificou-se o algoritmo de classificação RL com o método de seleção de variáveis SFM foi o que apresentou melhores resultados nas métricas de avaliação do modelo. Obtendo-se como resultados um modelo com 36 variáveis, a área abaixo da curva ROC (AUC-ROC) de 0,833 e a área abaixo da curva precision-recall (AUC-PR) de 0,582. Conclui-se que a idade, os antipsicóticos e a glicose demonstraram-se mais relevantes para a previsão do delirium. E, embora o modelo de previsão ainda possa ser melhorado, apresenta-se como ferramenta interessante para o auxílio de diagnóstico de delirium em ambiente hospitalar. Increased life expectancy is an indicator of improved quality of life, but it is also associated with an increase in chronic diseases. Due to the multiple physiological changes that characterise the elderly, it is expected that this age group is particularly vulnerable to the adverse effects of hospitalisation. Small changes in the individual caused by the change of disease state may promote states of confusion and disorientation. Delirium is a common manifestation of severe acute neuropsychiatric dysfunction, prevalent in hospital environment, which due to its variability of clinical presentation is often under diagnosed and neglected. In this sense, the topic of this dissertation emerged, whose purpose was focused on the development of a model capable of predicting the occurrence or not of delirium. To this end, Python language and a database collected in a Portuguese hospital between 2014 and 2016 were used. The developed model was implemented in a web application, available through the following link: https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. The machine learning algorithms tested were random forest and logistic regression. Before pattern recognition process, the dataset was cleaned, features and records with no relevance for delirium prediction were eliminated. Then, a feature engineering was performed, which included grouping medicines by pharmacological group and transformation of categorical data to make it interpretable by machine learning algorithms. Feature selection was performed using wrapper method, in which the Sequential Feature Selector, Recursive Feature Elimination and Select From Model methods were tested. From the models studied, the logistic regression algorithm with the Select From Model feature selection method was the one that displayed best evaluation metrics. The outcome obtained was a 36 features model with an area under a receiver operating characteristic curve (AUC-ROC) of 0.833 and an area under curve precision-recall (AUC-PR) of 0.582. Based on the model selected, age, antipsychotics and glucose were shown to be relevant for delirium prediction. And, although the prediction model can still be improved, this approach might be a useful support tool to identify patients at increased risk of delirium in healthcare settings.
Tipo:	Dissertação de mestrado
Descrição:	Dissertação de mestrado em Engenharia de Sistemas
URI:	https://hdl.handle.net/1822/80037
Acesso:	Acesso aberto
Aparece nas coleções:	BUM - Dissertações de Mestrado DPS - Dissertações de Mestrado