Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/65489

TitleModelos de previsão com Big Data proveniente de transações financeiras
Other titlesForecasting models from Big Data financial transactions
Author(s)Simões, Joana Patrícia da Silva
Advisor(s)Castro, Cecília
Campos, Pedro
KeywordsEconomia colaborativa
Dados em painel
Modelos de efeitos mistos
Árvores de regressão
Amostra de treino / amostra de teste
Collaborative economy
Panel data
Mixed models
Regression trees
Train / test set
Issue date2019
Abstract(s)A troca de serviços, por determinado período de tempo, com compensação monetária ou outra, através de plataformas digitais é um fenómeno bastante recente, designado por economia colaborativa. Esta realidade é ainda pouco compreendida, e o tipo de trocas/ transações incluídas neste conceito, ainda não são consideradas no cálculo de indicadores macroeconómicos como, por exemplo, o PIB. No entanto, há necessidade de estudar mais pormenorizadamente este tipo de economia para poder englobá-la no cálculo de indicadores de atividade económica, ou outros, já existentes. É este o principal objetivo do projeto ESSNet Big Data II – Financial Transactions Data, onde este trabalho se insere, sob a alçada do INE Porto. Nesta tese, utilizam-se variáveis que podem ser consideradas dentro de um conceito de economia colaborativa. Tais variáveis foram introduzidas em modelos de efeitos fixos e em modelos de efeitos aleatórios, conseguindo explicar o PIB além de proporcionarem modelos com elevado poder preditivo. Uma vez que o foco se encontra na previsão, propõem-se aqui modelos de machine learning bastante recentes, árvores de regressão com inclusão de efeitos aleatórios, que demonstram também elevado poder preditivo, embora em comparação com os modelos de efeitos mistos apresentados, ficam ligeiramente aquém pela natureza linear dos dados utilizados. Para a execução deste trabalho, recorreu-se a dados de levantamentos nacionais em caixas de multibanco, de compras através de terminais de pagamento automático e de dormidas nos estabelecimentos hoteleiros, ou seja, dados de transações financeiras que, em abstrato, são dados de economia colaborativa, pelo menos numa definição lata deste paradigma. Estes dados encontram-se agregados por regiões NUTS III e por ano, o que impõe que sejam tratados como dados em painel, tendo em conta a heterogeneidade entre as regiões.
A new paradigm arises in economy, consisting in the exchange of services, for a certain period of time, with monetary compensation or other, through digital platforms. It’s a recent phenomenon, called collaborative economy. This reality is still poorly understood, and the type of transactions included in this definition are not yet considered in the calculation of macroeconomic indicators such as GDP. However, it is necessary to study this type of economy in more detail in order to be able to include it in indicators of economic activities. This is the focus of the ESSNet Big Data II project - Financial Transactions Data, where this work is included under the guidance of NSI, Porto, Portugal. In this thesis, we use variables that can be considered within a concept of collaborative economy. These variables were introduced in fixed effects models and random effects models, being able to explain the GDP and provide models with high predictive power. Since the focus is on prediction, very recent machine learning models are used here, like regression trees with random effects, which also show high predictive power. Although these models compared with mixed effects models, are slightly less powerful because of the linear nature of the data handled. In this work, we used data from national withdrawals at ATMs, purchases through automatic payment terminals and overnight stays in hotel establishments, i.e. financial transaction data that, in abstract, are “collaborative economy” data, at least in a broad definition of this paradigm. These data are aggregated by regions and by year, which requires the use of a panel data approach, taking into account the heterogeneity between regions.
TypeMaster thesis
DescriptionDissertação de mestrado em Estatística
URIhttp://hdl.handle.net/1822/65489
AccessOpen access
Appears in Collections:BUM - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Dissertacao+33694.pdf756,51 kBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID