Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/79890
Título: | Comparative analysis and characterization of industrial Streptococcus thermophilus genomes |
Autor(es): | Isabelinho, Tiago Filipe Pereira |
Orientador(es): | Dias, Oscar Demirci, Huseyin Rau, Martin Holm Zeidan, Ahmad |
Palavras-chave: | Streptococcus thermophilus Pan-genome Melhoramento Síntese de aminoácidos Protéases Transportadores Identificação Motifs Improvement Amino acids biosynthesis Transporters Identification |
Data: | 22-Jul-2019 |
Resumo(s): | A evolução de técnicas de sequenciação de nova geração originou um crescimento
exponencial do número de genomas sequenciados. O pan-genoma permite uma visão global
de múltiplos genomas. Este é definido como o completo conjunto de genes presente nos
genomas em estudo, sobre os quais estabelecem-se relações de ortologia. Neste trabalho, uma
visão geral e avaliação da performance de quatro diferentes ferramentas (FindMyFriends,
OrthoMCL, Proteinortho e Roary) de deteção de ortólogos foi efectuada com uma
similaridade de 0.95 e a não separação de parálogous em 21 genomas públicos. As
ferramentas apresentaram uma performance global positiva com diferentes aplicabilidades
dependendo do objectivo do trabalho.
Streptococcus thermophilus é uma bactéria ácido-láctica amplamente usada na
produção de iogurte e queijo, associada com o seu sabor e textura. O estudo do seu pan-genoma envolvendo 333 genomes foi estabelecido pelo FindMyFriends com o objectivo da
caracterização genómica para perceber a diversidade da espécie e características para o seu
desenvolvimento. Correspondência entre o pan-genome e a base de dados KEGG foi
efectuada através do K number, de modo a, identificar e/ou reconstruir o metabolismo dos
carbohidratos, vias de biossíntese dos aminoácidos, transportadores ABC de aminoácidos e
enzimas proteolíticas. A disrupção do gene glucokinase nas estirpes S e GA faz delas bons
candidatos a aumentar a doçura do iogurte. Cerca de 21% das estirpes são auxotróficas para
a histidina. Situações pontuais de auxotrofia foram encontradas em relação a outros
aminoácidos. A protease extracelular PrtS não foi identificada em 153 estirpes, devendo estas
ser co-cultivadas ou depender de outras proteases extracelular para atingir uma taxa de
crescimento ótimo e acidificação. Em relação às peptidases intracelulares, quatro estirpes
podem ter uma menor taxa de crescimento e menor composição de aminoácidos, percussores
de compostos aromáticos. Uma maior capacidade de transporte de polipeptídeos poderá ser
notória em 10 estirpes pela identificação de uma terceira cópia do gene oppA.
Existe sequências de DNA que influenciam e ajudam na iniciação do processo de
transcrição e tradução de genes. Identificação dos promotores, caixa de pribnow e sequência
-35, e da sequencia de Shine-dalgarno (SDS), dos genes pertencentes ao pan-genoma mostrou
que a localização dos promotores é variável ao invés da SDS que se localiza nos 20bp a
montante do sítio de iniciação da tradução. Este estudo do pan-genoma facilitará estudos
fenotípicos para a fermentação do leite, melhorando os produtos lácteos. The evolution of next-generation sequencing techniques gave rise to an exponential growth of the number of sequenced genomes. Pan-genome allows a global vision of multiple genomes. It is defined as the entire set of genes present in a group of genomes under study, on which orthology relationships are established. In this work, an overview and performance assessment of four different orthologous detection tools (FindMyFriends, OrthoMCL, Proteinortho e Roary) was done with a 0.95 similarity parameter and not splitting paralogous, in 21 public genomes. Tools show a good overall performance with different applicabilities depending on the work’ goals. Streptococcus thermophilus is a lactic acid bacterium widely used as a dairy starter to yogurt and cheese production, associated with their flavour and texture. Pan-genome study involving 333 genomes was stablished by FindMyFriends with the goal of genomic characterization to understand strain diversity and characteristics for their development. Matching between pan-genome and KEGG database through K numbers was done in order to identified and/or reconstructed carbohydrate metabolism, amino acid biosynthesis pathways, amino acid ABC transporters and proteolytic enzymes. Glucokinase gene disruption on strain S and GA make them good candidates to increase naturally yogurt sweetness. About 21% strains are histidine auxotrophic. Other residual auxotrophic situations were found regarding other amino acids. Extracellular protease PrtS was not identified in 153 strains, which must be co-cultivated or rely in other extracellular proteases to reach an optimal growth rate and acidification. Regarding intracellular peptidases, four strains could have a lower growth rate and a low amino acid composition, precursors of aromatic compounds. A greater transport capacity may be notorious in 10 strains by the identification of a thirth copy gene oppA. There are DNA sequences that affect and help in the start of the gene transcription and translation process. Identification of the promoters, pribnow box and sequence -35, and Shine-Dalgarno sequence (SDS) from genes belonging to pan-genome show that promoters’ location is variable instead of SDS that is in the 20bp upstream of the translation initiation site. This pan-genome study will facilitate phenotypic studies for milk fermentation, improving dairy products. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/79890 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tiago Filipe Pereira Isabelinho.pdf | Dissertação de Mestrado | 2,41 MB | Adobe PDF | Ver/Abrir |