Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/53110

TítuloBases de dados em grafos: estudo exploratório no âmbito das bases de dados NoSQL
Autor(es)Salgado, Filipe André Lopes
Orientador(es)Pereira, José Luís
Palavras-chaveBig data
NoSQL
SQL
Cypher
Graph databases
Relational databases
Data2017
Resumo(s)Depois de várias décadas de grande sucesso e bons serviços prestados às organizações, a tecnologia relacional de bases de dados tem vindo a ser desafiada por uma nova classe de tecnologias de bases de dados, a que se deu a designação genérica de NoSQL (Not only SQL). Para este facto contribuíram decisivamente os recentes desenvolvimentos na área a que se tem vindo a chamar Big Data, na qual, dada a complexidade e volume dos conjuntos de dados a gerir, o tradicional modelo relacional começou a apresentar dificuldades. Dentro desta nova classe de tecnologias de bases de dados surgiram diferentes propostas, com distintas proveniências e áreas de aplicação, vulgarmente classificadas em quatro grupos, de acordo com o seu modelo de dados: orientado a colunas, orientado a documentos, pares Chave-Valor e orientado a grafos. Dada a grande diversidade de propostas atualmente existentes em cada um dos modelos de bases de dados NoSQL, torna-se pertinente compreender as suas características específicas e áreas de aplicação mais relevantes, enquanto, simultaneamente se vincam as suas diferenças relativamente às tradicionais bases de dados relacionais. Em particular, aborda-se uma das quatro classes de bases de dados em que o mundo NoSQL se divide – as bases de dados orientadas a Grafos, de que produtos como o Neo4J, OrientDB ou Titan são alguns dos principais representantes. Neste trabalho é realizado uma caracterização do contexto Big Data e analisado o papel das bases de dados NoSQL nesse mesmo contexto. De seguida, são estudados os produtos NoSQL atualmente mais representativos de entre as bases de dados em grafos tais como os referidos anteriormente, e é feito uma análise comparativa entre um deles – Neo4J, e uma base de dados relacional – SQL Server 2014. São identificadas vantagens e desvantagens desse produto relativamente à base de dados relacional, assim como é realizado uma comparação de desempenho de diversas consultas entre o SQL Server 2014 e o Neo4J em 4 cenários distintos e com diferente número de acessos simultâneos, onde, de uma maneira geral, a base de dados em Grafo desempenha melhor.
After several decades of great success and good services to organizations, relational databases technology has been challenged by a new class of database technologies, NoSQL (Not only SQL) Databases. Recent developments in Big Data, where there are datasets with a lot of complexity and volume, the traditional relational model has begun to present difficulties to manage them. Within this new class of databases technologies, different proposals have emerged, with different origins and areas of application. These areas of application are usually classified into four groups, according to their data model: column oriented databases, document oriented databases, Key-Value databases and graph oriented databases. Once there is a wide range of NoSQL Database proposals currently available, it is relevant to understand their specific characteristics and most relevant applications areas, and also, to find the differences between these 4 models comparing to the relational databases. In this project, we focus in one of four NoSQL databases - the Graph-oriented Databases, where products like Neo4J, OrientDB or Titan are the main representatives. Thus, with this work we characterize the Big Data context and analyze the role of the NoSQL Databases in this same context. Then, are studied the most representative NoSQL products of Graph Databases such as those mentioned above, and made a comparative analysis between them. It is also identified advantages and disadvantages of one of these products - Neo4J comparing to one relational database - SQL Server 2014. Also, it is compared the performance of the products mentioned above, in four distinct scenarios with different number of simultaneous access, where, in a general way, Neo4J performs better.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
URIhttps://hdl.handle.net/1822/53110
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DSI - Engenharia e Gestão de Sistemas de Informação

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Filipe André Lopes Salgado.pdf3,77 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID