Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/2336

TitleGeoCensus: extracção de informação geográfica da Web
Author(s)Macedo, Joaquim
Santos, Maribel Yasmina
KeywordsWorld Wide Web
Localização geográfica
Exploração de dados
Issue date13-Nov-2002
CitationENCONTRO DE UTILIZADORES DE INFORMAÇÃO GEOGRÁFICA (ESIG), 7, Oeiras, 2002.
Abstract(s)O sistema GeoCensus tem como objectivo a extracção de informação geográfica da Web. Através da colecta exaustiva (para já apenas uma amostra significativa) de páginas Web existentes em Portugal, o sistema localiza geograficamente os servidores que hospedam as páginas colectadas. A localização geográfica das páginas pode ser realizada usando diferentes fontes de informação, nomeadamente a localização geográfica dos servidores Web que hospedam as páginas, os nomes geográficos extraídos do seu conteúdo e a localização geográfica das páginas adjacentes na topologia da Web. Estas fontes diferentes de evidência geográfica podem ser usadas, de forma combinada ou isolada, para localizar geograficamente as audiências das páginas (público alvo). A utilização de diferentes fontes de informação permite uma maior abrangência do sistema de localização geográfica, uma vez que uma grande parte das páginas não têm informação geográfica explícita ou apresentam poucos relacionamentos (nós de entrada e saída) na topologia da Web. Desta forma, a localização duma página pode ser determinada quer pela informação explícita que contém, quer pelas relações que estabelece na topologia Web (páginas que referencia ou em que é referenciada) e também pela localização geográfica do servidor Web em que está hospedada. Caso as diferentes fontes de evidência existam, a sua combinação pode permitir aumentar o eficácia do sistema. Este artigo apresenta o sistema GeoCensus, descrevendo os diversos componentes que integram a sua arquitectura e ainda as diferentes tecnologias utilizadas na sua concretização. São ainda sistematizadas as diversas heurísticas para cálculo estimado do âmbito geográfico das páginas. Para já, é apenas explorada a localização geográfica dos servidores que hospedam as páginas e as ligações entre as páginas estabelecidas pelas referências. São apresentados resultados ilustrativos com toda a informação necessária para o cálculo do âmbito geográfico das páginas.
TypeConference paper
URIhttp://hdl.handle.net/1822/2336
Peer-Reviewedyes
AccessOpen access
Appears in Collections:DSI - Engenharia da Programação e dos Sistemas Informáticos

Files in This Item:
File Description SizeFormat 
ESIG2002_JM_MYS.pdf499 kBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID