Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/64771

TitleA comprehensive phylogenetic analysis of Mycobacterium tuberculosis protein-coding genes: insights into evolution and virulence
Author(s)Pereira, Daniela Sofia Gaspar
Advisor(s)Rito, Teresa S
Soares, Pedro
KeywordsEvolution of mycobacterium tuberculosis
Bioinformatics
Phylogenetics
Horizontal gene transfer (HGT)
Evolução de Mycobacterium tuberculosis
Bioinformática
Filogenética
Transferência horizontal de genes
Issue date2018
Abstract(s)Understanding the evolutionary relationships between organisms is a complex issue that has gained importance not only in evolution but also in clinical and biological inferences, only possible with technological advances that require new analytical tools. In this work, the main focus is to study the genome of Mycobacterium tuberculosis, the causal agent of tuberculosis, establishing a detailed evolutionary framework.The secondary objective, regardless of the focus on the evolution of Mtb, is that the pipeline created can be applied to any other organism. This dissertation presents some basic facts about tuberculosis, an infectious bacterial disease caused by the Mycobacterium tuberculosis complex, its constitution, evolution, pathology, drug resistance and genetic variation. Our objectives were contextualized considering the most up-to-date tools of alignment and phylogenetics, an area in constant progress due to the growing needs of bioinformatics tools in the area of genomics and evolution. Taxonomic and genetic data were compiled from all organisms with complete genomes in NCBI. This database was subsequently cured by eliminating redundant genomes, i.e., containing only one representative element of each species with the complete proteome. A search of each Mycobacterium tuberculosis protein in this local database using BLAST allowed the detection of probable homologs in a large number of taxonomically informative organisms. The search results were limited to two hundred homologues, which were aligned using MUSCLE. Phylogenetic trees, based on maximum likelihood were constructed for the approximately four thousand Mycobacterium tuberculosis proteins. The phylogenetic relationship and monophyly of Mycobacterium tuberculosis with the remaining bacteria of the same genus(Mycobacterium) and the same family (Corynebacteriaceae) were studied to understand possible processes of acquisition of genes by horizontal transference. Finally, positive selection processes were studied by searching for excess or deficit of non-synonymous mutations in relation to the synonymous (Ka / Ks) using the CODEML software, in order to identify branches with an accelerated evolution in the establishment of the pathogenic species Mycobacterium tuberculosis. These genes may form the basis of the physiological and biochemical characteristics that make this bacterium pathogenic to humans.
Compreender as relações evolutivas entre os organismos é uma questão complexa que ganhou cada vez mais relevo no âmbito não apenas da evolução mas para inferências clínicas e biológicas, só possíveis com os avanços tecnológicos, que exigem novas ferramentas analíticas. Neste trabalho,o foco principal é estudar o genoma da Mycobacterium tuberculosis, o agente causal da tuberculose, estabelecendo-se um quadro evolutivo detalhado. O objetivo secundário, independentemente do foco na evolução da Mtb, é que a pipeline criada possa ser aplicada a qualquer outro organismo. Esta dissertação apresenta alguns fatos básicos sobre a tuberculose, uma doença infeciosa bacteriana causada pelo complexo Mycobacterium tuberculosis, sobre a sua constituição, evolução, patologia, resistência aos medicamentos e variação genética. Os nossos objetivos foram contextualizados considerando as mais atualizadas ferramentas de alinhamento e de filogenética, uma área em constante progresso devido às crescentes necessidades de ferramentas bioinformáticas na área da genómica e evolução. Foram compilados dados taxonómicos e genéticos de todos os organismos com genomas completos no NCBI. Esta base de dados foi posteriormente curada eliminando-se genomas redundantes, ou seja, contendo apenas um elemento representativo de cada espécie com o proteoma completo. Uma busca de cada proteína da Mycobacterium tuberculosis nesta base de dados local utilizando o BLASTpermitiu a deteção de prováveis homólogos num vasto número de organismos taxonomicamente informativos. Os resultados da busca foram limitados a duzentos homólogos, que foram alinhados recorrendo ao MUSCLE. Árvores filogenéticas, baseadas em máxima verossimilhança foram construídas para as cerca de quatro mil proteínas da Mycobacterium tuberculosis. A relação filogenética e monofilia da Mycobacterium tuberculosis com as restantes bactérias do mesmo género (Mycobacterium) e da mesma família (Corynebacteriaceae) foram estudadas para compreender possíveis processos de aquisição de genes por transferência horizontal. Finalmente, processos de seleção positiva foram estudados através da procura de excesso ou défice de mutações não sinónimas em relação às sinónimas (Ka/Ks) usando o software CODEML, de modo a identificar ramos com uma evolução acelerada no estabelecimento da espécie patogénica Mycobacterium tuberculosis. Esses genes podem estar na base das características fisiológicas e bioquímicas que tornam esta bactéria patogénica para o Homem.
TypeMaster thesis
DescriptionDissertação de mestrado em Bioinformatics
URIhttp://hdl.handle.net/1822/64771
AccessEmbargoed access (3 Years)
Appears in Collections:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Daniela-Sofia-Gaspar-Pereira-dissertação.pdf
  Until 2022-01-01
12,44 MBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID