Utilize este identificador para referenciar este registo: http://hdl.handle.net/1822/56115

TítuloA metagenomic approach to identify and characterize wastewater populations
Autor(es)Martins, Sara Patrícia Monteiro
Orientador(es)Santos, P. M.
Palavras-chaveWhole shotgun metagenomic
Next-generation sequencing
Effluent-treatment plant
Data2017
Resumo(s)Water scarcity and pollution are two main ecological focus nowadays. Knowledge of wastewater composition, regarding microorganisms and pollutants, is of great importance to improve the capacities of the effluent treatment plants (ETP). Advances in Next-generation sequencing (NGS) methodologies allowed for faster, cheaper and more accurate study of microbial communities. Besides being an extremely powerful analysis resource, whole shotgun metagenomic analysis comprises many challenging aspects, regarding the processing and analysis. In the present work a shotgun metagenomic bioinformatics analysis was performed comprising three samples from common ETPs (CETP) and four samples from a petrochemical complex ETPs (wastewaters with low and high salts collected in two distinct timepoints). The samples were sequenced with Illumina® HiSeq, generating paired-end reads with 2x150bp length. The main goals of this project were to evaluate currently available tools, establish a customized bioinformatics pipeline and to extract relevant biological information from the sequenced datasets. There were generated simulated datasets representative of the target data, in order to evaluate the performance of the available bioinformatics tools. Datasets were generated with three coverage levels and were used to test pre-processing, assembly and taxonomic tools. The target datasets, both with and without coverage split, were then subjected to processing and analysis using the pre-defined pipeline. A preliminary functional study was also performed using MG-RAST and MGX. Results from the evaluation of the performance of the bioinformatics tools showed that different tools behave differently in distinct datasets. The pipeline was defined using BayesHammer and Fastq-mcf as pre-processing tools, SPAdes for assembly and MetaPhlAn v2.0 for the taxonomical analysis. The assembly results for the target datasets showed a higher contiguity for high coverage levels and a lower contiguity for low coverage levels, highlighting the differences in microorganisms’ abundance and diversity and its impact during analysis. Taxonomical composition suggests the presence of putative pathogenic and opportunistic microorganisms on two of the CETP datasets (A2 and AKR12). It also suggests a more hostile environment in petrochemical complex ETPs datasets, which is concordant with a higher abundance of defence mechanisms on this datasets. The present results must be accounted to the effluent treatment processes.
A escassez de água e a poluição são dois dos principais problemas ecológicos atualmente. O conhecimento da composição das águas residuais, referente a microrganismos e poluentes, é de grande importância para melhorar as capacidades das estações de tratamento de águas residuais (ETAR). Os avanços nos métodos de sequenciação de nova geração permitiram o estudo mais rápido, barato e preciso de comunidades microbianas. Apesar de ser um meio de análise altamente poderoso, a análise metagenómica por whole shotgun compreende muitos aspetos desafiadores, no que respeita o processamento e a análise. No presente trabalho, uma análise bioinformática de dados metagenómicos de shotgun foi efetuada incluindo três amostras de ETARs comuns e quatro amostras de ETARs de um complexo petroquímico (águas residuais com baixos e altos teores de sais, colhidas em dois momentos distintos). As amostras foram sequenciadas com Illumina® HiSeq, gerando paired-end reads com comprimento igual a 2x150pb. Os principais objetivos deste projeto foram avaliar ferramentas disponíveis atualmente, estabelecer uma pipeline bioinformática personalizada e extrair informação biológica relevante dos datasets sequenciados. Foram gerados datasets simulados representativos dos dados a analisar, de forma a avaliar a performance das ferramentas bioinformáticas disponíveis. Os datasets foram gerados com três níveis de coverage e foram usados para testar ferramentas de pré-processamento, assembly e taxonomia. Os datasets alvo, com e sem divisão por coverage, foram então sujeitos a processamento e análise usando a pipeline pré-definida. Um estudo funcional preliminar foi realizado com MG-RAST e MGX. Os resultados da avaliação da performance das ferramentas bioinformáticas mostraram que diferentes ferramentas comportam-se de forma diferente em datasets distintos. A pipeline foi definida usando BayesHammer e Fastq-mcf como ferramentas de pré-processamento, SPAdes para assembly e MetaPhlAn v2.0 para a análise taxonómica. Os resultados de assembly para os datasets alvo mostraram uma grande contiguidade para altos níveis de coverage e baixa contiguidade para baixos níveis de coverage, realçando as diferenças de abundância e diversidade dos microrganismos e o seu impacto durante a análise. A composição taxonómica sugere a presença de microrganismos potencialmente patogénicos e oportunistas nos dois datasets de ETARs comuns (A2 e AKR12). Sugere também um ambiente mais hostil nos datasets das ETARs do complexo petroquímico, o que é concordante com uma maior abundância de mecanismos de defesa nestes datasets. Os presentes resultados devem ser tidos em conta nos processos de tratamento de águas residuais. Palavras-chave: metagenómica de whole shotgun, sequenciação de nova geração, estação de tratamento de águas residuais.
TipomasterThesis
DescriçãoDissertação de mestrado em Bioinformatics
URIhttp://hdl.handle.net/1822/56115
AcessoembargoedAccess (3 Years)
Aparece nas coleções:DI - Dissertações de Mestrado
CEB - Dissertações de Mestrado / MSc Dissertations
BUM - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Sara-Patrícia-Monteiro-Martins-dissertação.pdf1,96 MBAdobe PDFVer/Abrir  Solicitar cópia ao autor!

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu Currículo DeGóis