Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/62116
Title: | Computação segura em bases de dados NoSQL |
Author(s): | Macedo, Ricardo Gonçalves |
Advisor(s): | Oliveira, Rui Carlos Mendes de Paulo, João Tiago Medeiros |
Issue date: | 2017 |
Abstract(s): | Hoje em dia é usual as empresas necessitarem de analisar e processar quantidades massivas
de dados, levando-as a optar pela utilização de serviços de bases de dados na nuvem,
tirando proveito do poder de armazenamento e computação da nuvem reduzindo, desta
forma, os custos de aquisição e administração de uma infraestrutura privada.
No entanto, os serviços de nuvem têm vindo a sofrer ataques (p.e., ataque à Sony Pictures
Entertainment, fuga de 68 milhões de passwords da Dropbox, fuga de fotos de celebridades
da iCloud), onde grandes quantidades de informação crítica e privada, seja de grandes empresas
ou do utilizador final, são comprometidas e muitas vezes divulgadas à comunidade
geral. Da mesma forma, as empresas que fornecem estes serviços (p.e., Google), efetuam
análises sobre os dados armazenados com o objetivo de capturar o máximo de informação
do utilizador de modo a traçar um perfil, e por fim vender estas informações a empresas
por motivos de publicidade.
Dada esta falha de privacidade, esta dissertação visa explorar e implementar mecanismos
de computação segura sobre bases de dados NoSQL fornecendo armazenamento, processamento
e transmissão de dados de forma segura e transparente. Em detalhe, esta dissertação
apresenta as seguintes contribuições: uma revisão extensa e detalhada do estado da arte
atual dos sistemas de computação segura sobre bases de dados SQL e NoSQL, bem como sobre
os esquemas criptográficos mais frequentes e relevantes suportados por estes sistemas
seguros. Deste estudo é ainda proposta uma arquitetura genérica e taxonomia dos sistemas
de computação segura atuais. Como segunda contribuição é proposto um sistema denominado
SafeNoSQL que apresenta uma arquitetura modular e extensível de computação segura
sobre bases de dados NoSQL. Ainda, esta arquitetura é concretizada num protótipo
que suporta a base de dados Apache HBase e inclui quatro técnicas criptográficas que permitem
o armazenamento e processamento seguro sobre informação sensível armazenada
em serviços de terceiros não confiáveis. De forma a validar o protótipo é efetuada uma
avaliação experimental detalhada com micro e macro testes e testes de carga com múltiplos
clientes, sendo feita não só a avaliação do desempenho mas também da utilização de recursos
computacionais (p.e., CPU, memória) para cada um dos testes. Os resultados mostram
que é possível atingir uma solução segura e funcional para workloads realistas, obtendo um
custo no desempenho da base de dados inferior a 15%. Como contribuição final, é proposta
a integração do sistema SafeNoSQL com um componente de tradução de SQL para
NoSQL de forma a extender as vantagens de segurança a aplicações tradicionais que apenas
suportam o modelo e interface SQL. Companies are increasingly dependent on storage and processing solutions that can handle massive amounts of data. Cloud database services are a good fit for this challenge as they provide both capabilities in a remote cloud infrastructure, thus alleviating enterprises from buying and managing their own private data center. However, cloud services are now a popular target for malicious attacks (e.g., Sony Pictures Entertainment hack, Dropbox leak of 68 million passwords, iCloud leak of celebrity photos) in which large amounts of private and sensitive information, from either large companies or end-users, have been leaked. Also, cloud providers (e.g., Google) have access to clients’ data and are able to process it to extract meaningful information that may be sold to companies for publicity purposes. Cloud data privacy is thus a main concern that needs to be addressed. This thesis aims to explore and apply secure computation schemes over NoSQL databases while delivering secure data storage, processing and transmission. In detail, the following contributions are presented: a detailed state-of-the-art revision was made for the current secure SQL and NoSQL database systems, as well as, for the most relevant cryptographic techniques adopted by these systems. Moreover, this review proposes a generic architectural abstraction and a taxonomy for classifying all these solutions. As a second contribution, a generic framework called SafeNoSQL is proposed and provides a modular and extensible design that enables secure data processing over NoSQL databases. Also, a prototype of SafeNoSQL, based on Apache HBase, is implemented along with a set of four distinct cryptographic libraries that leverage secure storage and computation over sensible data stored on untrusted third-party infrastructures. The prototype is validated with an extensive experimental evaluation resorting to both micro, macro and multi-client experiments. These experiments validate not only the performance of the solution but also its resource usage (e.g., CPU, RAM). The results show that it is possible to achieve a practical and secure solution for realistic workloads with a database throughput and latency overhead inferior to 15%. As a final contribution, we propose the integration of SafeNoSQL with a query engine in order to further extend the secure computation and storage guarantees to traditional SQL applications. |
Type: | Master thesis |
Description: | Dissertação de mestrado integrado em Engenharia Informática |
URI: | https://hdl.handle.net/1822/62116 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Ricardo-Gonçalves-Macedo-dissertação-final.pdf | 1,77 MB | Adobe PDF | View/Open |