Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/27895
Title: | Taxonomic and functional analysis of metagenomes |
Author(s): | Barbosa, Pedro Santos |
Advisor(s): | Rocha, Miguel Arrais, Joel Perdiz |
Issue date: | 2013 |
Abstract(s): | Over the years, metagenomics has demonstrated to play an essential role on
the study of the microorganisms that live in microbial communities, particularly
those who inhabit the human body. Several bioinformatic tools and
pipelines have been developed, but usually they only address one question:
"Who is there?" or "What are they doing?".
This work aimed to develop a computational framework to answer the
two questions simultaneously, that is, perform a taxonomic and functional
analysis of microbial communities. Merlin, a previously developed software
designed for the construction of genome-scale metabolic models for single
organisms, was extended to deal with metagenomics data. It has an userfriendly
and intuitive interface, not requiring command-line knowledge and
further libraries dependencies or installation, as many other tools.
The extended version of Merlin can predict the taxonomic composition
of an environmental sample based on the results of homology searches, where
the proportions of phyla and genera present are discriminated. Regarding
the metabolic analysis, it allows to identify which enzymes are present and
calculate their abundance, as well as to nd out which metabolic pathways
are e ectively present.
The performance of the tool was evaluated with samples from the Human
Microbiome Project, particularly from the saliva. The taxonomic membership
predicted in Merlin was in agreement with other tools, despite some
di erences in the proportions. The functional characterization showed a conserved
pool of pathways through di erent samples, although Merlin sometimes
presented less pathways than expected because the routine is highly
dependent on the enzymes annotation. Overall, the results showed the same
pattern as reported before: while the pathways needed for microbial life remain
relatively stable, the community composition varies extensively among
individuals.
In the end, Merlin demonstrated to be a reliable standalone alternative
to web services for those scientists that have concerns about sharing data. Ao longo dos anos, a metagenómica demonstrou ter um papel essencial no estudo dos microorganismos que vivem em comunidades bacterianas, particularmente aqueles que habitam o corpo humano. Várias ferramentas e pipelines bioinformáticas foram desenvolvidas, mas normalmente estas apenas abordam uma destas questões: "Quem está lá?" ou "O que é que estão a fazer?" Este trabalho teve como objectivo o desenvolvimento duma ferramenta computacional para responder aos dois problemas em simultâneo, isto é, realizar tanto uma análise taxonómica como funcional de comunidades microbianas. O Merlin, um software anteriormente desenvolvido para construir modelos metabólicos à escala genómica para um organismo, foi estendido para tratar dados de metagenómica. O programa possui uma interface intuitiva e amiga do utilizador, não necessitando de conhecimentos de linha de comandos nem de dependências de bibliotecas ou instalação de aplicações adicionais. Esta versão estendida do Merlin prevê a composição taxonómica global dum metagenoma baseado nos resultados de procuras de sequências homólogas, onde as proporções dos fila e géneros são apresentadas. No que diz respeito à análise metabólica, o Merlin permite identificar quais as enzimas presentes e calcular a sua abundância, bem como identificar quais as vias metabólicas que estão efectivamente presentes. O desempenho da ferramenta foi avaliado com amostras do Projecto do Microbioma Humano, particularmente com amostras da saliva. A composição taxonómica prevista no Merlin esteve de acordo com outras ferramentas, apesar de algumas diferenças observadas nas proporções. A caracterização funcional mostrou um conjunto conservado de vias metabólicas nas diferentes amostras, mesmo que o Merlin tenha identificado menos enzimas que o esperado, pois o método é bastante dependente do processo anotação. Globalmente, os resultados revelaram o mesmo padrão reportado anteriormente: enquanto as vias metabólicas necessárias para a vida microbiana se mantêm estáveis, a composição taxonómica varia bastante entre indivíduos. No final, o Merlin demonstrou ser uma alternativa fidedigna a serviços web para aqueles cientistas que têm restrições em divulgar os seus dados não publicados num website. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/27895 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
eeum_di_dissertacao_pg20232.pdf | 3,36 MB | Adobe PDF | View/Open |