Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/55842
Title: | Development of web-based tools for metabolomics data analysis and mining |
Author(s): | Cardoso, Sara Manso de Sousa |
Advisor(s): | Rocha, Miguel Maraschin, Marcelo |
Issue date: | 2017 |
Abstract(s): | The recent advances in metabolomics experimental techniques have provided novel approaches
for many research issues in the biological fields. Indeed, the ability to identify
and quantify numerous compounds in biological samples provides significant advances in
functional genomics, biomarker identification, sample characterization or drug discovery
and development. To take full advantage of these data advanced bioinformatics methods
for data analysis and mining have been required.
A number of methods and tools for metabolomics data analysis have been put forward
recently, being one of the major limitations still faced the lack of integrated frameworks for
extracting relevant knowledge from these data and being able to integrate these data with
previous biochemical knowledge. Also, the lack of reproducibility in many data analyses
or data mining processes is a strong obstacle for biological discovery.
In recent work from the host group, specmine, a metabolomics and spectral data analysis/
mining framework, in the form of a package for the R system, has been developed to
address some of these issues.
In this thesis, an integrated web-based platform for metabolomics data analysis and mining,
named WebSpecmine, was designed and developed, based on the specmine package, thus
providing an easier and friendly user interface. This website provides means for analysing
metabolomics data from different formats, including tasks such as pre-processing, univariate
and multivariate analysis and metabolite identification. This web-based platform was
developed collaboratively and, therefore, this work focused mainly in data from nuclear
magnetic ressonance and mass spectrometry.
Also, the package faced some limitations regarding types of analysis not yet provided,
such as metabolite identification for other data formats besides Mass Spectrometry coupled
to Liquid Chromatography. Therefore, the extension of the metabolite identification feature
was addressed, by implementing such analysis for Nuclear Magnetic Ressonance data in
the specmine package, as well as making it available in the website.
The website was validated by applying it to reproduce the pipelines from previous studies
that made use of the specmine package. Furthermore, a case study involving banana
peels and the analysis of their characteristics and potential made use of the newly created
website to further validate its functionality. All the analyses here executed were stored and
are available in the web application, as public projects. Os mais recentes avanços nas técnicas experimentais metabolómicas têm levado a novas abordagens de muitas questões na investigação em áreas biológicas. De facto, a capacidade de identificar e quantificar os inúmeros compostos presentes nas amostras biológicas veio provocar enormes avanços na genómica funcional, identificação de biomarcadores, caracterização de amostras e descoberta e desenvolvimento de drogas. Para tirar maior partido destes dados, é necessário a existência de métodos avançados de bioinformática para a análise e mineração de dados. Vários métodos e ferramentas que permitem a análise de dados metabolómicos têm vindo a ser apresentadas, tendo no entanto como grande limitação a falta de extração de conhecimento relevante destes dados e integrá-los com conhecimento bioquímico anterior. Para além disto, a falta de reprodutibilidade de muitas análises de dados ou de processamentos de mineração é um grande obstáculo à descoberta biológica. Em trabalhos recentes do grupo de acolhimento foi desenvolvido um package para o sistema R por forma a abordar algumas destas questões. Este package, denominado specmine, permite a análise e mineração de dados espectrais e de metabolómica. Na presente tese, uma plataforma web integrada para a análise e mineracão de dados de metabolómica, denominada WebSpecmine, foi desenvolvida, baseada no package specmine, fornecendo assim uma interface simples e fácil para o usuário. Este site permite a análise de dados de metabolómica de formatos diferentes, incluindo pre-processamento, análises univariada e multivariada, e identificação de metabolitos. Esta plataforma web foi desenvolvida de forma colaborativa e, deste modo, o presente trabalho focou-se maioritariamente em dados provenientes das técnicas espectrometria de massa e ressonância magnética nuclear. Para além disto, o package apresentava algumas limitações no que toca a tipos de análise ainda não disponíveis, como é o caso da identificação de metabolitos para outros formatos de dados que não a espectrometria de massa acoplada com cromatografia líquida. Assim, a funcionalidade de identificação de metabolitos no specmine package foi estendida a dados de ressonância magnética nuclear, bem como também implementada no website. O site foi validado através da sua aplicação para reproduzir pipelines de estudos anteriores que fizeram uso do package specmine. Para além disto, um estudo de caso envolvendo cascas de banana e a análise das suas características e potencial, fez uso do site recentemente criado para também validar a sua funcionalidade. Todas as análises aqui executadas foram guardadas na aplicação web, estando disponíveis para consulta, como projectos públicos. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Bioinformatics |
URI: | https://hdl.handle.net/1822/55842 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Sara-Manso-de-Sousa-Cardoso-dissertação.pdf | 2,8 MB | Adobe PDF | View/Open |