Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/82763

TítuloComputational approaches for the integration of in vitro chemical and genetic screening data sets
Autor(es)Cunha, Ana Beatriz Gonçalves da
Orientador(es)Rocha, Miguel
Cortés-Ciriano, Isidro
Palavras-chaveTumour heterogeneity
Single-cell RNA Sequencing
Drug activity prediction
Drug combinations
Deep learning
Heterogeneidade tumoral
Sequenciação RNA Single-cell
Previsão da atividade farmacológica
Combinação de fármacos
Data1-Nov-2021
Resumo(s)Cellular heterogeneity plays an important role in tumour development and is often associated with poor prognosis, unsuccessful treatment, and relapse. Most therapeutic approaches do not account for the presence of drug-resistant clones within the tumour, that can affect the success of the treatment, and therefore it is crucial to address tumour heterogeneity in the clinic. Artificial intelligence is being increasingly introduced into Research & Development, especially in drug development. Current methodologies use information from in vitro cell line cultures as their source of biological signal, and drug screens. Models using this kind of data have clear limitations since they do not fully recapitulate cancer development in vivo. Furthermore, they also do not account for intratumour heterogeneity. This dissertation aims to develop deep learning models to predict the activity of drugs and drug combi nations at single-cell resolution using single-cell RNA sequencing technologies. The novelty of this project is the use of single-cell data that, if successful, could allow the identification of different populations of clones. First, two Variational Autoencoders were trained to analyse and compress both inputs, namely the molecular information and gene expression, that will be used as input to the deep learning models trained to predict the activity of compounds. They both proved to be a valid and efficient way to process the input without losing or compromising the signal. After processing the input, two models were trained to predict drug activity, Gradient Boosting Machines and Neural Networks. Overall, these models showed great results, particularly the Light Gradient Boosting Machines, with spearman correlations between real and predicted sensitivities around 0.8. Lastly, both architectures were also used to predict the drug combination synergy scores. These models showed average, but promising results, with spearman correlations between real and predicted synergies around 0.4. In a nutshell, this work shows that it is possible to predict drug activity using single-cell data. However, due to the novelty of this technology, the amount of data available is limited, which limited the performance of the models. Nevertheless, both models showed their potential, and as more data become available, the more the models will learn and make better predictions.
A heterogeneidade celular tem um papel bastante importante no desenvolvimento tumoral, e está fre quentemente associada a mau prognóstico e falhas no tratamento, que poderá culminar em recidivas. A maioria das opções terapêuticas existentes não têm em consideração a presença de clones resistentes ao tratamento no tumor, que podem interferir com o sucesso da terapia. Assim sendo, a heterogeneidade tumoral é um ponto crucial que deve ser abordado em contexto clínico. A inteligência artificial está a ser aplicada cada vez mais na investigação, particularmente no desen volvimento de fármacos. As metodologias atuais utilizam informação proveniente de culturas de linhas celulares in vitro como fonte de sinal biológico e de estudos farmacológicos. Todavia, estes modelos ap resentam limitações evidentes, dado que não recapitulam o total desenvolvimento tumoral in vivo. Além disso, estes modelos também não têm em conta a heterogeneidade intratumoral. Esta dissertação tem como objetivo o desenvolvimento de modelos de deep learning para a previsão da atividade de fármacos e da sinergia de combinação de fármacos, ao nível celular, usando para isso dados de tecnologias de sequenciação single-cell. A inovação deste trabalho é o uso deste tipo de dados que, se bem-sucedido, poderá permitir a identificação de diferentes populações de clones tumorais. Numa primeira fase, dois Variational Autoencoders foram treinados de forma a serem capazes de analisar e comprimir os diferentes inputs (informação molecular e expressão genética), que foram depois utilizados como input para os modelos seguintes para a previsão da atividade dos fármacos. Ambos os variational autoencoders mostraram ser opções válidas e bastante eficientes para o processamento dos dados iniciais, sem perda e/ou comprometimento da informação. De seguida, dois modelos foram treinados para a previsão da atividade dos fármacos, mais especifica mente Gradient Boosting Machines e Redes Neuronais. De uma forma geral, estes modelos mostraram excelentes resultados, particularmente as Light Gradient Boosting Machines, com uma correlação de spearman entre os valores de actividade reais e previstos de 0.8. Por último, os mesmos tipos de modelos foram treinados para preverem os valores de sinergia entre combinação de fármacos. Estes modelos mostraram resultados promissores, com uma correlação de spearman entre os valores de sinergia reais e previstos de 0.4. Em epítome, este trabalho demonstra que é possível prever a atividade farmacológica usando dados single-cell. Todavia, devido ao facto desta tecnologia ser bastante recente, a quantidade de informação e dados disponíveis é reduzida, o que limita o sucesso dos modelos. Não obstante, ambos os modelos mostraram que têm bastante potencial e, assim que mais informação fique disponível, mais os modelos irão aprender e serão capazes de fazer melhores previsões.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação)
URIhttps://hdl.handle.net/1822/82763
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
CEB - Dissertações de Mestrado / MSc Dissertations

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Ana Beatriz Goncalves da Cunha.pdf14,62 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID