Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/82763
Título: | Computational approaches for the integration of in vitro chemical and genetic screening data sets |
Autor(es): | Cunha, Ana Beatriz Gonçalves da |
Orientador(es): | Rocha, Miguel Cortés-Ciriano, Isidro |
Palavras-chave: | Tumour heterogeneity Single-cell RNA Sequencing Drug activity prediction Drug combinations Deep learning Heterogeneidade tumoral Sequenciação RNA Single-cell Previsão da atividade farmacológica Combinação de fármacos |
Data: | 1-Nov-2021 |
Resumo(s): | Cellular heterogeneity plays an important role in tumour development and is often associated with poor
prognosis, unsuccessful treatment, and relapse. Most therapeutic approaches do not account for the
presence of drug-resistant clones within the tumour, that can affect the success of the treatment, and
therefore it is crucial to address tumour heterogeneity in the clinic.
Artificial intelligence is being increasingly introduced into Research & Development, especially in drug
development. Current methodologies use information from in vitro cell line cultures as their source of
biological signal, and drug screens. Models using this kind of data have clear limitations since they do
not fully recapitulate cancer development in vivo. Furthermore, they also do not account for intratumour
heterogeneity.
This dissertation aims to develop deep learning models to predict the activity of drugs and drug combi nations at single-cell resolution using single-cell RNA sequencing technologies. The novelty of this project
is the use of single-cell data that, if successful, could allow the identification of different populations of
clones.
First, two Variational Autoencoders were trained to analyse and compress both inputs, namely the
molecular information and gene expression, that will be used as input to the deep learning models trained
to predict the activity of compounds. They both proved to be a valid and efficient way to process the input
without losing or compromising the signal.
After processing the input, two models were trained to predict drug activity, Gradient Boosting Machines
and Neural Networks. Overall, these models showed great results, particularly the Light Gradient Boosting
Machines, with spearman correlations between real and predicted sensitivities around 0.8.
Lastly, both architectures were also used to predict the drug combination synergy scores. These models
showed average, but promising results, with spearman correlations between real and predicted synergies
around 0.4.
In a nutshell, this work shows that it is possible to predict drug activity using single-cell data. However,
due to the novelty of this technology, the amount of data available is limited, which limited the performance
of the models. Nevertheless, both models showed their potential, and as more data become available, the
more the models will learn and make better predictions. A heterogeneidade celular tem um papel bastante importante no desenvolvimento tumoral, e está fre quentemente associada a mau prognóstico e falhas no tratamento, que poderá culminar em recidivas. A maioria das opções terapêuticas existentes não têm em consideração a presença de clones resistentes ao tratamento no tumor, que podem interferir com o sucesso da terapia. Assim sendo, a heterogeneidade tumoral é um ponto crucial que deve ser abordado em contexto clínico. A inteligência artificial está a ser aplicada cada vez mais na investigação, particularmente no desen volvimento de fármacos. As metodologias atuais utilizam informação proveniente de culturas de linhas celulares in vitro como fonte de sinal biológico e de estudos farmacológicos. Todavia, estes modelos ap resentam limitações evidentes, dado que não recapitulam o total desenvolvimento tumoral in vivo. Além disso, estes modelos também não têm em conta a heterogeneidade intratumoral. Esta dissertação tem como objetivo o desenvolvimento de modelos de deep learning para a previsão da atividade de fármacos e da sinergia de combinação de fármacos, ao nível celular, usando para isso dados de tecnologias de sequenciação single-cell. A inovação deste trabalho é o uso deste tipo de dados que, se bem-sucedido, poderá permitir a identificação de diferentes populações de clones tumorais. Numa primeira fase, dois Variational Autoencoders foram treinados de forma a serem capazes de analisar e comprimir os diferentes inputs (informação molecular e expressão genética), que foram depois utilizados como input para os modelos seguintes para a previsão da atividade dos fármacos. Ambos os variational autoencoders mostraram ser opções válidas e bastante eficientes para o processamento dos dados iniciais, sem perda e/ou comprometimento da informação. De seguida, dois modelos foram treinados para a previsão da atividade dos fármacos, mais especifica mente Gradient Boosting Machines e Redes Neuronais. De uma forma geral, estes modelos mostraram excelentes resultados, particularmente as Light Gradient Boosting Machines, com uma correlação de spearman entre os valores de actividade reais e previstos de 0.8. Por último, os mesmos tipos de modelos foram treinados para preverem os valores de sinergia entre combinação de fármacos. Estes modelos mostraram resultados promissores, com uma correlação de spearman entre os valores de sinergia reais e previstos de 0.4. Em epítome, este trabalho demonstra que é possível prever a atividade farmacológica usando dados single-cell. Todavia, devido ao facto desta tecnologia ser bastante recente, a quantidade de informação e dados disponíveis é reduzida, o que limita o sucesso dos modelos. Não obstante, ambos os modelos mostraram que têm bastante potencial e, assim que mais informação fique disponível, mais os modelos irão aprender e serão capazes de fazer melhores previsões. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática (especialização em Tecnologias da Informação) |
URI: | https://hdl.handle.net/1822/82763 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Ana Beatriz Goncalves da Cunha.pdf | 14,62 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons