Polyglot: sistema poliglota de processamento de dados

Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/64602

Título:	Polyglot: sistema poliglota de processamento de dados
Autor(es):	Gonçalves, Hugo Manuel Ramos Vilas Boas
Orientador(es):	Pereira, José Maia, Francisco Almeida Neves, Francisco Nuno Teixeira
Data:	2018
Resumo(s):	O aumento exponencial do volume de dados gerados no mundo tecnológico atual é incontestável. A necessidade de armazenar e processar esses grandes volumes de dados levou a indústria a optar por soluções de armazenamento e processamento na nuvem. Além disto, os desenvolvedores optam cada vez mais por sistemas de base de dados que permitem melhor desempenho e também tirar partido da variedade estrutural dos dados face aos sistemas relacionais tradicionais. Estes sistemas que estão a surgir apresentam modelos de dados baseados em estruturas como, p.e., grafos ou índices chave-valor, e oferecem interfaces que podem ser apenas duas operações (PUT/GET) ou, à semelhança dos sistemas relacionais com o SQL, ter linguagens de interrogação específica. Contudo, a migração de praticamente todos os componentes das infraestruturas das aplicações para a nuvem implica que os dados sejam processados e armazenados em infraestruturas de terceiros, ficando muitas vezes a privacidade destes comprometida. Por outro lado, um dado problema pode ter dados com estruturas diferentes ou partes diferentes de uma aplicação podem ter necessidades diferentes quanto aos dados e, por isso, a diversidade entre sistemas de armazenamento leva uma grande complexidade em desenvolver sistemas que usem várias fontes de dados diferentes e heterogéneas eficientemente. Assim, esta dissertação pretende dar uma resposta à problemática da gestão de dados de forma privada nas aplicações web, potencializando a utilização de múltiplos sistemas de fontes de dados heterogéneas. Em específico, esta dissertação apresenta uma nova arquitetura, à qual se chamou Polyglot, que permite a manutenção da privacidade dos dados, enquanto ao mesmo tempo possibilita a utilização de múltiplas fontes de dados heterogéneas e tira partido da nuvem para grande parte do processamento. Esta arquitetura é também implementada sob a forma de um protótipo direcionado a um sistema de monitorização, que consiste no caso de estudo desta dissertação. Este protótipo permite comprovar a validade da arquitetura, sendo que a implementação feita demonstra todas as funcionalidades essenciais ao funcionamento do sistema. Mais ainda, este protótipo é também avaliado a nível de desempenho e utilização de recursos, permitindo demonstrar a viabilidade deste sistema para uma utilização em cenários reais. Por último exploram-se algumas das funcionalidades mais relevantes que se poderiam adicionar ao sistema e os ganhos que estas trariam face à implementação atual, demonstrando o potencial do protótipo. The exponential growth of the volume of data currently generated in the technological world is undeniable. The need to store and process these large amounts of data lead the industry to choose storing and processing solutions based on cloud services. Moreover, developers are increasingly choosing database systems that have better performance and also allow take advantage of the structural variety of data, when compared to traditional relational systems. These surging systems’ data models are based on structures such as, for instance, node graphs or key-value indexes and offer interfaces that can be only two operations (PUT/GET) or, similarly to the relational systems and SQL, have its own specific query language. However, the migration of practically every component of an application infrastructure to the cloud means the data is processed and stored in a third party’s infrastructure, usually compromising data privacy. On another hand, a single problem can have data with multiple structures or different parts of a given application may have different needs regarding data, and so, the diversity among database systems leads to great complexity while developing systems that use multiple and disparate data sources efficiently. This dissertation aims at answering the problem of private data management in web applications, while boosting the use of multiple disparate data sources. Specifically, this dissertation presents a new architecture, called Polyglot, which allows the maintenance of data privacy, whilst allowing the use of disparate data sources and taking advantage of the cloud for most processing. This architecture is then implemented on a prototype, which was developed for integration with a monitoring system, which is the dissertation’s case study. This prototype proves the validity of the architecture, since the implementation showcases all the major features required for the system to work. This prototype is experimentally evaluated, with metrics being taken for performance and resources usage, and showing the validity of this system for a real scenario usage. Lastly we explore some of the most relevant features that could be added to the system, showing the increases in performance and resource economization they would bring, when compared to the current implementation, showcasing the potential of this system.
Tipo:	Dissertação de mestrado
Descrição:	Dissertação de mestrado integrado em Engenharia Informática
URI:	https://hdl.handle.net/1822/64602
Acesso:	Acesso aberto
Aparece nas coleções:	BUM - Dissertações de Mestrado DI - Dissertações de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Hugo-Manuel-Ramos-Vilas-Boas-Gonçalves-dissertação.pdf		1,49 MB	Adobe PDF	Ver/Abrir

Ver registo completo Sugerir correção Estatísticas