Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/27867
Title: | Network inference: extension of linear programming model for time-series data |
Author(s): | Matos, Marta R. A. |
Advisor(s): | Mendes, Rui Knapp, Bettina |
Issue date: | 2013 |
Abstract(s): | With the widespread availability of high-throughput technologies, it is now possible
to study the behavior of dozens or even hundreds of gene/proteins through a
single experiment. Still, these experiments provide only the gene/protein expression
values, telling nothing about their interactions with each other. To understand
these interactions, network inference methods need to be applied. By understanding
such interactions, new light can be shed into biological processes and, in particular,
into disease’s mechanisms of action, providing new insights for drug design: which
genes/proteins should be targeted in order to cure/prevent a specific disease.
In this thesis, we developed and tested two alternative extensions for a previously
developed model based on linear programming. Such model infers signal transduction
networks from perturbation steady-state data. The extensions now developed take
advantage of perturbation time-series data, which further improves the resolution of
causal relationships between genes/proteins.
In a first phase, we use artificial networks with simulated data to test the performance
of both extensions in different conditions. Additionally, we compare their performance
to the original model and to a state-of-the-art model for perturbation timeseries
data, DDEPN. Overall, our second extension exhibits a better performance,
and significantly higher sensitivity. This extension assumes a given gene/protein can
only influence its targets if it is in an active form.
In a second phase, we use two experimental datasets related to ERBB signaling
and evaluate the resulting networks: 1) by finding literature support for the inferred
edges, and 2) by using a network assembled with Ingenuity IPA as true network to
do a quantitative assessment. Our results are further compared to DDEPN and the
original model in a quantitative way. Quantitatively, our second model extension is
shown to perform better than both the original model and DDEPN. Qualitatively,
we find literature support for most of the inferred edges in both datasets, while also
inferring a few plausible edges for which no literature evidence was found. Com o uso generalizado de tecnologias de alto rendimento como os microarrays de ADN, torna-se comum estudar dezenas ou mesmo centenas de genes/proteínas numa única experiência. Contudo, estas experiências apenas nos permitem determinar a expressão dos genes/proteínas e nada nos dizem sobre as interações entre os mesmos. Assim, torna-se necessário o uso de métodos de inferência de redes, de modo a estudar as interações entre genes/proteínas. Ao perceber estas interações, não só é possível perceber melhor os processos biológicos em geral, como também o modo como actuam as doenças, de forma a desenvolver novos medicamentos. Nesta tese de mestrado, desenvolvemos e testámos duas extensões para um modelo baseado em programação linear. Este modelo infere redes de transdução de sinal a partir de experiências de RNAi em que as medidas são feitas após a perturbação, quando a rede se encontra em estado estacionário. Com as extensões desenvolvidas nesta tese é possível tirar partido de séries temporais de dados provenientes de experiências de RNAi, o que permite distinguir relações de causalidade entre proteínas. Numa primeira fase, usamos redes artificiais e dados simulados para testar a performance de ambas as extensões em diferentes condições. Além disso, comparamo-las com o modelo original e com um modelo recente, DDEPN, que usa séries temporais de dados de experiências em que a rede a inferir é perturbada. Em geral, a nossa segunda extensão obtém melhores resultados, principalmente em termos de sensibilidade. Esta extensão assume que só proteínas activas podem influenciar outras proteínas. Numa segunda fase, usamos dois conjuntos de dados experimentais e avaliamos os resultados obtidos: 1) procurando referências na literatura para as ligações inferidas, e 2) usando uma rede de referência para fazer uma avaliação quantitativa e estabelecer comparações com o modelo original e o DDEPN. Quantitativamente, a nossa segunda extensão obtém melhores resultados do que o modelo original e o DDEPN. Qualitativamente, encontrámos suporte na literatura para a maioria das ligações inferidas pela segunda extensão. Inferimos ainda algumas ligações bastante plausíveis, embora não tenhamos encontrado suporte para estas. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Engenharia Informática |
URI: | https://hdl.handle.net/1822/27867 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
eeum_di_dissertacao_pg18677.pdf | 1,99 MB | Adobe PDF | View/Open |