Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/92352
Título: | Aplicação de técnicas de análise de sobrevivência numa coorte de COVID-19 |
Autor(es): | Duarte, Leandro dos Santos Xavier |
Orientador(es): | Machado, Luís Meira Moreira, Carla Maria Gonçalves Macedo |
Palavras-chave: | Análise de sobrevivência Modelos de cura de mistura COVID-19 Estimador de Kaplan-Meier Modelos de regressão de Cox Survival analysis Mixture cure models Kaplan-Meier estimator Cox regression |
Data: | 16-Fev-2024 |
Resumo(s): | O COVID-19 é causado pelo vírus SARS-COV-2, que é parte da família coronavírus e que pode
causar desde doenças mais leves até as mais graves. Além disso, ele possui grande capacidade de
espalhar-se rapidamente e de apresentar muitas mutações genéticas, fazendo com que surgissem
(e ainda possam surgir) diversas variantes [1].
Outro facto que devemos nos atentar é que mesmo após a cura do vírus, ainda há a possibilidade de sofrermos pelas sequelas causadas no processo de recuperação, as quais podem perdurar
por semanas ou até serem irreversíveis, o que é chamado de Long-COVID (ou COVID prolongada,
em português), Post-Covid, Post-Acute Sequelae entre outros termos [1].
Os estudos publicados sobre o tema compreendem questões acerca da mortalidade ou do
tempo de internamentos, pouco se sabendo sobre o tempo de resolução de todos os sintomas e
quais são os fatores que influenciam a sua resolução, os quais são importantes para prevermos
como será a progressão da doença num indivíduo ao longo do tempo, determinando os possíveis
fatores de risco (ou os protetores) até a completa cura para que as instituições de saúde possam
agir de forma rápida e precisa.
No intuito de alcançarmos esse objetivo, analisamos a base de dados fornecida pelo laboratório
do Centro Hospitalar Universitário de São João (CHUSJ), que possui informações dos pacientes
diagnosticados com COVID-19 e que responderam ao questionário sobre quais sintomas tiveram e
por quantos dias os sofreram. À época do estudo, ainda não havia disponibilidade de vacina para
o COVID-19, razão pela qual isto não pôde ser contemplado no estudo.
Considerando que estamos interessados no tempo até a resolução dos sintomas e que há observações censuradas, as técnicas mais adequadas são as de análise de sobrevivência, pois ignorar
a presença de censura pode fazer com que os riscos sejam subestimados (ou superestimados, dependendo do tipo de censura existente). Mais precisamente, aplicamos técnicas de modelos de
cura de mistura (MCM) porque a função de sobrevivência estava em um platô, apresentando mais de um terço dos participantes sem a resolução de todos os sintomas durante o período observado.
Como conclusão, vimos que os fatores em estudo, idade, sexo ao nascimento, presença de
comorbidades, perceção de renda, uso regular de medicamentos e hospitalização foram significativamente associadas ao tempo de resolução de todos os sintomas, apesar de alguns não entrarem
nos modelos finais devido ao critério de parcimónia.
Para o modelo de regressão de Cox múltiplo, os homens possuíram, em média, aproximadamente 62% mais risco de terem o evento de interesse (resolução de todos os sintomas) quando
comparado às mulheres (HR: 1,619; 95% do IC: [1,469 , 1,785]); participantes com comorbidades
apresentaram, em média, aproximadamente 12% a menos de risco de terem o evento de interesse
quando comparados com os que não possuíam comorbidades (HR: 0,879; 95% do IC: [0,797 ,
0,970]); à medida que piora a perceção da renda menor é o risco de ter o evento de interesse;
indivíduos que foram hospitalizados durante a fase aguda da COVID-19 apresentaram, em média,
aproximadamente 24% a menos de risco quando comparados aos que não foram hospitalizados
(HR: 0,761; 95% CI: [0,660 , 0,878]). Estas interpretações também foram obtidas pelo modelo
de regressão paramétrica com a distribuição de Weibull, o qual também pode ser considerado
com o pressuposto de riscos proporcionais. Também foram apresentados modelos paramétricos
sob as distribuições lognormal e loglogística, os quais contiveram os mesmos fatores dos modelos
anteriores.
Para o Modelo de Cura de Mistura (MCM), a variável sexo ao nascimento deve estar presente
na incidência (efeito de longo prazo) e na latência (efeito de curto prazo), enquanto comorbidades
deve estar presente na incidência e hospitalização na latência. Utilizando este modelo, a estimativa
para a proporção de indivíduos que não obteriam a resolução de todos os sintomas foi de 41,8%
para mulheres com comorbidades, 35,2% para mulheres sem comorbidades, 29,0% para homens
com comorbidades e de 23,7% para homens sem comorbidades, enquanto o fator hospitalização
não interfere na estimativa de curados. COVID-19 is caused by the SARS-COV-2 virus, which is part of the coronavirus family and can cause anything from mildest to most severe illnesses. In addition, it has a great capacity to spread rapidly and to present many genetic mutations, causing several variants to emerge (and still may arise) [1]. Another fact that we must pay attention to is that even after the cure of the virus, there is still the possibility of suffering from the sequelae caused in the recovery process, which can last for weeks or until they are irreversible, which is called Long-COVID, Post-COVID, Post-Acute Sequelae among other terms [1]. The studies published on the subject include questions about mortality or hospitalisations, little is known about the time to resolution of all symptoms and what factors influence it, so that we can predict how the progression of the disease will be in an individual over time, determining the possible improvements (or complications) until the complete cure so that health institutions can act quickly and accurately. To achieve this goal, we analysed the database provided by the central laboratory of the Centro Hospitalar Universitário de São João (CHUSJ), which has information on patients diagnosed with SARS-CoV-2 infection and who answered the questionnaire about what symptoms they had and for how many days they suffered them. At the end of the study, there was still no vaccine available for COVID-19, which is why it could not be included in the study. Considering that we are interested in the time to resolution of all symptoms and that there are censored observations, the most appropriate techniques are those of survival analysis, because ignoring the presence of censoring can underestimate (or overestimate, depending on the type of censoring) the risks involved. More precisely, we applied techniques from mixture cure models (MCM) because the survival curve was in a plateau, with more than a third of the participants not having resolution of all symptoms during the observed period.In conclusion, we saw that the factors age, sex at birth, presence of comorbidities, income perception, regular use of medications and hospitalisation are significantly associated with the time of resolution of all symptoms, although some variables were not included in the final models due to the parsimony criterion. For the multiple Cox regression model, men had, on average, approximately 62% more risk of having the event of interest (resolution of all symptoms) when compared to women (HR: 1.619; 95% of CI: [1.469, 1.785]); Participants with comorbidities had, on average, approximately 12% less risk of having the event of interest when compared with those who did not have comorbidities (HR: 0.879; 95% of CI: [0.797, 0.970]); as the perception of income worsens, the lower the risk of having the event of interest becomes; individuals who were hospitalised during the acute phase of COVID-19 had, on average, approximately 24% lower risk when compared to those who were not hospitalized (HR: 0.761; 95% CI: [0.660, 0.878]). These interpretations were also obtained by the parametric regression model with the Weibull distribution, which can also be considered with the assumption of proportional risks. Parametric models were also presented under the lognormal and loglogistic distributions, which contained the same factors as the previous models. For the MCM, the variable sex at birth was present in incidence (long-term effect) and in latency (short-term effect), while comorbidities were present in incidence and hospitalisation in latency. Using this model, the estimate for the proportion of individuals who would not achieve resolution of all symptoms was 41.8% for women with comorbidities, 35.2% for women without comorbidities, 29.0% for men with comorbidities and 23.7% for men without comorbidities, while the hospitalisation factor does not interfere in the estimation of long-term cured patients. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Estatística para Ciência de Dados |
URI: | https://hdl.handle.net/1822/92352 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DMAT - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Leandro dos Santos Xavier Duarte.pdf | Dissertação de mestrado | 1,67 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons