Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/49099
Title: | Classification and structure-based inference of transcriptional regulatory proteins |
Author(s): | Barros, Diana Manuela Pinto |
Advisor(s): | Carneiro, S. Lourenço, Anália Maria Garcia |
Keywords: | Transcription factors Protein functional domains Escherichia coli Regulatory function Two-component signal transduction systems Global TFs Factores de transcrição Domínios proteicos funcionais Escherichia coli Funcção regulatória |
Issue date: | 2016 |
Abstract(s): | Transcription factors (TFs) are proteins that mediate the cellular response to the changes of the
surrounding environment. Studying their functional domains and protein structure is fundamental
in order to gain insight of the way they are triggered and how they shape genetic transcription.
The current work aimed for classifying both TFs and functional domains, understanding which
features can be related to the different functions of the TFs.
By using UniProtJAPI, a JAVA library that allows remote access to UniProt, the information
of 200 Escherichia coli’s (E. coli) TFs has been retrieved. This data was manually curated, in
order to remove domain duplicates and other excess information, and to add missing domains.
The obtained functional domains were classified according to their molecular function, while
the TFs were classified according to their regulatory function. TFs that exclusively induce gene
expression were classified as activators, while TFs that only perform gene repression were classified
as repressors. On the other hand, TFs that perform both the activation and repression of
transcription were classified as duals. The information was then analysed altogether in order
to understand what relationships between the TFs’ function and functional domains could exist.
Several analysis were performed, which include statistical tests and clustering methods. Along
with the analysis of the full list of TFs, TFs that are part of two-component signal transduction
systems and global TFs were given special focus, due to their important role in cellular function.
The results showed that there is a relationship between the functional domains and the regulatory
function of the different TFs. This may be related to the evolutionary relationships between
repressors and activators. It is also understandable that dual regulators are closely related to activators
and repressors than what activators and repressors are to each other. Moreover, TFs of
two-component signal transduction systems are similar to each other, given that they perform
similar functions. Their domain architectures are also predictable and do not vary from what
was expected of these TFs. However, in global TFs the results are opposite of the ones obtained
for two-component system TFs: their structures are very different from each other and each TF
is specific. The amount of different domains is high when comparing to the full sample of TFs,
since the number of domains exceeds the number of TFs. Domains of all classification types are
present in their structure and the domain architectures are varied, which reflects their different
activities within the cell. Os factores de transcrição (TFs) são proteínas que mediam resposta celular perante alterações do meio em que se inserem. Estudar os seus domínios funcionais e estrutura proteica é fundamental para compreender a forma como as suas funções são desencadeadas e como moldam a regulação da transcrição. Este trabalho teve como objectivos a classificação dos TFs de acordo com a sua função, assim como a classificação dos domínios funcionais. Através do uso da UniProtJAPI, uma biblioteca de JAVA que permite o acesso remoto à UniProt, foi recolhida informação de 200 TFs da Escherichia coli (E. coli). Estes dados foram curados manualmente, com o objectivo de remover domínios duplicados e outra informação em excesso, assim como de adicionar domínios em falta. Os domínios funcionais obtidos foram classificados de acordo com a sua função molecular, enquanto que os TFs foram classificados de acordo com a sua função regulatória. TFs que exclusivamente induzem a expressão genética foram classificados como activadores, enquanto que TFs que apenas reprimem a expressão genética foram classificados como repressores. Por usa vez, TFs que tanto induzem como reprimem a expressão genética foram classificados como duais. A informação dos domínios e dos TFs foi considerada como um todo de forma a compreender quais as possíveis relações entre a função regulatória dos TFs e os domínios funcionais. Várias análises foram efectuadas, das quais testes estatísticos e métodos de clustering. Para além da análise de todos os TFs, foi também feita uma análise de TFs que fazem parte de two-component transduction systems e TFs globais, devido à sua importância na actividade celular. Os resultados demonstram que existe uma relação entre os domínios funcionais e a função regulatória dos TFs. Esta pode ter a ver com as relações evolucionárias dos activadores e repressores. É, também, perceptível que os reguladores duais relacionam-se com mais proximidade dos activadores e dos repressores do que os activadores e os repressores se relacionam entre si. Para além disso, TFs de two-component transduction systems têm estruturas semelhantes , uma vez que desempenham funções idênticas. As duas arquitecturas de domínios também são previsíveis e não variam do que era esperado. Contudo, para os TFs globais, os resultados são antagónicos: as suas estruturas são diferentes umas das outras e cada TF é específico. A quantidade de domínios diferentes é elevada em comparação com a amostra completa de TFs, uma vez que o número de domínios excede o número de TFs. Domínios de todas as classificações estão presentes na estrutura dos TFs globais e as arquitecturas de domínios são variadas, o que reflecte as suas actividades específicas na célula. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/49099 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Diana Manuela Pinto Barros.pdf | 2,87 MB | Adobe PDF | View/Open |