Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/47450
Title: | Machine learning approaches for predicting effects of drug combinations in cancer |
Other titles: | Métodos de aprendizagem máquina para a previsão de efeitos de combinações de medicamentos no tratamento de cancro |
Author(s): | Baptista, Delora Soeiro |
Advisor(s): | Rocha, Miguel Machado, Carlos Daniel Moutinho |
Issue date: | 27-Jul-2016 |
Abstract(s): | Drug combination therapies are commonly used to overcome tumor drug
resistance. Computational methods can be helpful tools in drug combination
discovery, but there are currently no e stablished methods for the prediction of
drug combination effects.
This work, integrated in the AstraZeneca -Sanger Drug Combination
Prediction challenge launched by the Dialogue for Reverse Engineering
Assessments and Methods (DREAM) community, aimed to develop machine
learning methods to estimate the effects of drug combinations on cancer cell
lines. The challenge was divided into three subchallenges (1A, 1B, and 2)
addressing different clinical scenarios.
A variety of machine learning models were devel oped and evaluated
using cross-validation. Tree-based ensembles, particularly GB, performed best
for this problem. Among the different the genomic datasets provided, the
monotherapy, mutation and CNV datasets were the most informative and were
the only ones used in the final models.
The best model, submitted to 1A, was an ensemble of gradient boosting
(GB), random forest (RF), and partial least squares (PLS) regression models,
having achieved an average weighted Pearson correlation of 0.30, and ranking
24th among 76 submissions. The 1B model (average weighted Pearson
correlation of 0.18; 47th/62 submissions) was also an ensemble of GB, RF,
and PLS models. For subchallenge 2, a GB model was selected. It had a
performance score (based on a three-way analysis of variance (ANOVA) ) of 5.15
and ranked 20th out of 39 submissions.
The strategies explored in this work and by the DREAM challenge
community will help to further the development of computational methods for
the rational design of effective drug combinations for cancer therapy. A utilização de múltiplos fármacos em combinação é uma estratégia comum para superar a resistência a medicamentos em tumores. Métodos computacionais podem ser ferramentas valiosas na descoberta de novas combinações de interesse, mas atualmente não existe nenhum método estabelecido para este propósito. Este trabalho, integrado na iniciativa AstraZeneca-Sanger Drug Combination Prediction challenge proposta pela comunidade DREAM, tinha como objetivo o desenvolvimento de métodos de aprendizagem máquina para prever os efeitos de combinações de fármacos em linhas celulares tumorais. O problema encontrava-se dividido em três desafios (1A 1B e 2) que abordav am cenários clínicos distintos. Vários modelos foram desenvolvidos, sendo avaliados atr avés de validação cruzada. Conjuntos de modelos baseados em árvores de decisão conseguiram um melhor desempenho. De todos os conjuntos de dados, os dados de monoterapia, de mutações e de variação do número de cópia foram os mais informativos, tendo sido utilizados pelos mode los finais. O estimador utilizado para a tarefa 1A (média ponderada da correlação de Pearson de 0.30; 24º em 76 submissões) foi um conjunto composto por modelos de gradient boosting (GB), random forest (RF) e regressão por mínimos quadrados parciais (PLS). Para o problema 1B foi utilizado outro conjunto de modelos com GB, RF e PLS (0.18; 47º em 62 submissões). Para a questão 2, foi desenvolvido um modelo de GB que conseguiu um desempenho (calculado com base nos resultados de uma ANOVA) de 5.15, tendo sido o 20º melhor modelo num total de 39. As estratégias exploradas neste trabalho e pelas outras equipas que participaram neste desafio da comunidade DREAM são um contributo útil para o desenvolvimento futuro de métodos computacionais para o desenho racional de combinações de fármacos eficazes para o tratamento de tumores. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Bioinformática (área de especialização em Tecnologias da Informação) |
URI: | https://hdl.handle.net/1822/47450 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Delora Soeira Baptista.pdf | Tese | 1,09 MB | Adobe PDF | View/Open |