Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/29426

TitleMining microblogging data to model and forecast stock market behavior
Other titlesAnálise de dados de microblogs para modelar e prever o comportamento do mercado de ações
Author(s)Oliveira, Nuno Miguel da Rocha
Advisor(s)Cortez, Paulo
Issue date2013
Abstract(s)The analysis of microblogging data may disclose relevant signals of investor sentiment and attention that can be useful to model and predict stock market variables (Bollen, Mao, & Zeng, 2011; Mao, Counts, & Bollen, 2011; Oh & Sheng, 2011; Sprenger & Welpe, 2010). Moreover, microblogging data can provide sentiment and attention indicators in a more rapid and cost-effective manner than traditional sources (e.g., large scale surveys). In this project, we assessed the information content of microblogging data for explaining stock market variables. We created several indicators using Twitter data from nine major technological companies and analyzed their value when modeling returns, trading volume and volatility. Sentiment indicators were produced by exploring 5 popular lexical resources and two novel lexicons (emoticon based and the merge of all 6 lexicons) while attention indicators were based on the posting volume. Despite the short period analyzed (32 days), interesting results were obtained when measuring the value of using posting volume for fitting trading volume and volatility. However, we found scarce evidence that sentiment indicators can explain stock returns.
A análise de dados de microblogging pode revelar sinais relevantes do sentimento e atenção do investidor que podem ser úteis para modelar e prever variáveis do mercado de ações (Bollen et al., 2011; Mao et al., 2011; Oh & Sheng, 2011; Sprenger & Welpe, 2010). Adicionalmente, esta fonte de dados pode fornecer indicadores de sentimento e atenção de uma forma mais rápida e económica que fontes tradicionais (e.g., sondagens). Neste projecto, avaliamos o conteudo informativo dos dados de microblogging para explicar variáveis de mercados de ações. Criamos vários indicadores utilizando dados do Twitter sobre nove grandes empresas tecnológicas e analisamos o seu valor para modelar rendibilidade, volume de transação e volatilidade. Os indicadores de sentimento foram produzidos utilizando cinco recursos léxicos populares e dois novos lexicons (emoticons e união dos seis lexicons) enquanto que os indicadores de atenção se basearam no número de tweets. Apesar do curto período de tempo analisado (32 dias), obtivemos resultados interessantes na utilização do número de tweets para modelar o volume de transação e volatilidade. Contudo, encontramos evidência escassa que os indicadores de sentimento podem explicar as rendibilidades das ações.
TypeMaster thesis
DescriptionDissertação de mestrado em Information Systems Engineering and Management
URIhttp://hdl.handle.net/1822/29426
AccessOpen access
Appears in Collections:BUM - Dissertações de Mestrado
DSI - Engenharia e Gestão de Sistemas de Informação

Files in This Item:
File Description SizeFormat 
tese Nuno Oliveira-2013.pdf1,64 MBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID