Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/28065
Título: | Science data vaults in monetDB: a case study |
Autor(es): | Sá, João Nuno Araújo |
Orientador(es): | Pereira, José, 1973- Kertsen, Martin |
Data: | 26-Set-2011 |
Resumo(s): | Nowadays, the amount of data generated by scientific instruments (data captured) and
computer simulations (data generated) is very large. The data volumes are getting bigger,
due to the improved precision of the new instruments, or due to the increasing number
of collecting stations. This requires new scientific methods to analyse and organize the
data.
However, it is not so easy to deal with this data, and with all the steps that the data
have to get through (capture, organize, analyze, visualize, and publish). A lot of data is
collected (captured), but not curated (organized, analyzed) or published.
In this thesis we focus on the astronomical data, typically they are stored in FITS
files (Flexible Image Transport System). We will investigate the access and querying of
this data by means of database technology. The target database system is MonetDB, an
open-source column-store database with record of successful application to analytical
workloads and scientific applications (SkyServer).
Given the results of the experiments, the perceptible superiority presented by MonetDB
over STILTS when more computation is required, and the success obtained during
the execution of the use case proposed by an astronomer working at the CWI, we can
declare that MonetDB is a powerfull and robust alternative to manipulate and access
information contained in FITS files. Hoje em dia, a quantidade de dados gerada por instrumentos científicos (dados capturados) e por simulações de computador (dados gerados) é muito grande. A quantidade de dados está a tornar-se cada vez maior, quer por melhorias na precisão dos novos intrumentos, quer pelo aumento do número de estações que recolhem os dados. Isto requere novos métodos científicos que permitam analisar e organizar os dados. No entanto, não é fácil lidar com estes dados, e com todos os passos pelos quais necessitam de passar (capturar, organizar, analisar, visualizar e publicar). Muitos são coleccionados (captura), mas não são selecionados (organização, análise) ou publicados. Nesta tese focamo-nos nos dados astronómicos, que são geralmente armazenados em ficheiros FITS (Flexible Image Transport System). Vamos investigar o acesso a esses dados, e pesquisar informação neles contida, utilizando para isso uma tecnologia de base de dados. A base de dados alvo é o MonetDB, uma base de dados de armazenamento por colunas, de código livre, que já demonstrou ter sucesso em aplicações que analisam a carga de trabalho e aplicações científicas (SkyServer). Perante os resultados obtidos durante as experiências, a perceptível superioridade apresentada pelo MonetDB em relação à ferramenta STILTS quando mais computação é exigida, e por último, pelo sucesso na execução do conjunto de testes apresentado pelo astronómo que trabalha no CWI, podemos afirmar que o MonetDB é uma alternativa forte e robusta para manipular e aceder informação contida em ficheiros FITS. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação mestrado em Engenharia de Informática |
URI: | https://hdl.handle.net/1822/28065 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
eeum_di_dissertacao_pg15497.pdf | 1,12 MB | Adobe PDF | Ver/Abrir |