Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/92352

TítuloAplicação de técnicas de análise de sobrevivência numa coorte de COVID-19
Autor(es)Duarte, Leandro dos Santos Xavier
Orientador(es)Machado, Luís Meira
Moreira, Carla Maria Gonçalves Macedo
Palavras-chaveAnálise de sobrevivência
Modelos de cura de mistura
COVID-19
Estimador de Kaplan-Meier
Modelos de regressão de Cox
Survival analysis
Mixture cure models
Kaplan-Meier estimator
Cox regression
Data16-Fev-2024
Resumo(s)O COVID-19 é causado pelo vírus SARS-COV-2, que é parte da família coronavírus e que pode causar desde doenças mais leves até as mais graves. Além disso, ele possui grande capacidade de espalhar-se rapidamente e de apresentar muitas mutações genéticas, fazendo com que surgissem (e ainda possam surgir) diversas variantes [1]. Outro facto que devemos nos atentar é que mesmo após a cura do vírus, ainda há a possibilidade de sofrermos pelas sequelas causadas no processo de recuperação, as quais podem perdurar por semanas ou até serem irreversíveis, o que é chamado de Long-COVID (ou COVID prolongada, em português), Post-Covid, Post-Acute Sequelae entre outros termos [1]. Os estudos publicados sobre o tema compreendem questões acerca da mortalidade ou do tempo de internamentos, pouco se sabendo sobre o tempo de resolução de todos os sintomas e quais são os fatores que influenciam a sua resolução, os quais são importantes para prevermos como será a progressão da doença num indivíduo ao longo do tempo, determinando os possíveis fatores de risco (ou os protetores) até a completa cura para que as instituições de saúde possam agir de forma rápida e precisa. No intuito de alcançarmos esse objetivo, analisamos a base de dados fornecida pelo laboratório do Centro Hospitalar Universitário de São João (CHUSJ), que possui informações dos pacientes diagnosticados com COVID-19 e que responderam ao questionário sobre quais sintomas tiveram e por quantos dias os sofreram. À época do estudo, ainda não havia disponibilidade de vacina para o COVID-19, razão pela qual isto não pôde ser contemplado no estudo. Considerando que estamos interessados no tempo até a resolução dos sintomas e que há observações censuradas, as técnicas mais adequadas são as de análise de sobrevivência, pois ignorar a presença de censura pode fazer com que os riscos sejam subestimados (ou superestimados, dependendo do tipo de censura existente). Mais precisamente, aplicamos técnicas de modelos de cura de mistura (MCM) porque a função de sobrevivência estava em um platô, apresentando mais de um terço dos participantes sem a resolução de todos os sintomas durante o período observado. Como conclusão, vimos que os fatores em estudo, idade, sexo ao nascimento, presença de comorbidades, perceção de renda, uso regular de medicamentos e hospitalização foram significativamente associadas ao tempo de resolução de todos os sintomas, apesar de alguns não entrarem nos modelos finais devido ao critério de parcimónia. Para o modelo de regressão de Cox múltiplo, os homens possuíram, em média, aproximadamente 62% mais risco de terem o evento de interesse (resolução de todos os sintomas) quando comparado às mulheres (HR: 1,619; 95% do IC: [1,469 , 1,785]); participantes com comorbidades apresentaram, em média, aproximadamente 12% a menos de risco de terem o evento de interesse quando comparados com os que não possuíam comorbidades (HR: 0,879; 95% do IC: [0,797 , 0,970]); à medida que piora a perceção da renda menor é o risco de ter o evento de interesse; indivíduos que foram hospitalizados durante a fase aguda da COVID-19 apresentaram, em média, aproximadamente 24% a menos de risco quando comparados aos que não foram hospitalizados (HR: 0,761; 95% CI: [0,660 , 0,878]). Estas interpretações também foram obtidas pelo modelo de regressão paramétrica com a distribuição de Weibull, o qual também pode ser considerado com o pressuposto de riscos proporcionais. Também foram apresentados modelos paramétricos sob as distribuições lognormal e loglogística, os quais contiveram os mesmos fatores dos modelos anteriores. Para o Modelo de Cura de Mistura (MCM), a variável sexo ao nascimento deve estar presente na incidência (efeito de longo prazo) e na latência (efeito de curto prazo), enquanto comorbidades deve estar presente na incidência e hospitalização na latência. Utilizando este modelo, a estimativa para a proporção de indivíduos que não obteriam a resolução de todos os sintomas foi de 41,8% para mulheres com comorbidades, 35,2% para mulheres sem comorbidades, 29,0% para homens com comorbidades e de 23,7% para homens sem comorbidades, enquanto o fator hospitalização não interfere na estimativa de curados.
COVID-19 is caused by the SARS-COV-2 virus, which is part of the coronavirus family and can cause anything from mildest to most severe illnesses. In addition, it has a great capacity to spread rapidly and to present many genetic mutations, causing several variants to emerge (and still may arise) [1]. Another fact that we must pay attention to is that even after the cure of the virus, there is still the possibility of suffering from the sequelae caused in the recovery process, which can last for weeks or until they are irreversible, which is called Long-COVID, Post-COVID, Post-Acute Sequelae among other terms [1]. The studies published on the subject include questions about mortality or hospitalisations, little is known about the time to resolution of all symptoms and what factors influence it, so that we can predict how the progression of the disease will be in an individual over time, determining the possible improvements (or complications) until the complete cure so that health institutions can act quickly and accurately. To achieve this goal, we analysed the database provided by the central laboratory of the Centro Hospitalar Universitário de São João (CHUSJ), which has information on patients diagnosed with SARS-CoV-2 infection and who answered the questionnaire about what symptoms they had and for how many days they suffered them. At the end of the study, there was still no vaccine available for COVID-19, which is why it could not be included in the study. Considering that we are interested in the time to resolution of all symptoms and that there are censored observations, the most appropriate techniques are those of survival analysis, because ignoring the presence of censoring can underestimate (or overestimate, depending on the type of censoring) the risks involved. More precisely, we applied techniques from mixture cure models (MCM) because the survival curve was in a plateau, with more than a third of the participants not having resolution of all symptoms during the observed period.In conclusion, we saw that the factors age, sex at birth, presence of comorbidities, income perception, regular use of medications and hospitalisation are significantly associated with the time of resolution of all symptoms, although some variables were not included in the final models due to the parsimony criterion. For the multiple Cox regression model, men had, on average, approximately 62% more risk of having the event of interest (resolution of all symptoms) when compared to women (HR: 1.619; 95% of CI: [1.469, 1.785]); Participants with comorbidities had, on average, approximately 12% less risk of having the event of interest when compared with those who did not have comorbidities (HR: 0.879; 95% of CI: [0.797, 0.970]); as the perception of income worsens, the lower the risk of having the event of interest becomes; individuals who were hospitalised during the acute phase of COVID-19 had, on average, approximately 24% lower risk when compared to those who were not hospitalized (HR: 0.761; 95% CI: [0.660, 0.878]). These interpretations were also obtained by the parametric regression model with the Weibull distribution, which can also be considered with the assumption of proportional risks. Parametric models were also presented under the lognormal and loglogistic distributions, which contained the same factors as the previous models. For the MCM, the variable sex at birth was present in incidence (long-term effect) and in latency (short-term effect), while comorbidities were present in incidence and hospitalisation in latency. Using this model, the estimate for the proportion of individuals who would not achieve resolution of all symptoms was 41.8% for women with comorbidities, 35.2% for women without comorbidities, 29.0% for men with comorbidities and 23.7% for men without comorbidities, while the hospitalisation factor does not interfere in the estimation of long-term cured patients.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Estatística para Ciência de Dados
URIhttps://hdl.handle.net/1822/92352
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DMAT - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Leandro dos Santos Xavier Duarte.pdfDissertação de mestrado1,67 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID