Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/47696
Title: | Creating intelligible metrics road traffic analysis |
Author(s): | Quintas, Artur Filipe Freitas |
Advisor(s): | Analide, Cesar Silva, Fábio André Souto da |
Issue date: | 2016 |
Abstract(s): | The increasing pervasiveness and lower cost of electronic devices equipped with sensors
is leading to a greater and cheaper availability of localized information. The advent of
the internet has brought phenomena such as crowd-sourced maps and related data. The
combination of the availability of mobile information, community built maps, with the
added convenience of retrieving information over the internet creates the opportunity to
contextualize data in new ways.
This work takes that opportunity and attempts to generalize the detection of driving
events which are deemed problematic as a function of contextual factors, such as neighbouring
buildings, areas, amenities, the weather, and the time of day, week or month.
In order to research the problem at hand, the issue is first contextualized properly, providing
an overview of important factors, namely Smart Cities, Data Fusion, and Machine
Learning.
That is followed by a chapter concerning the state of the art, that showcases related
projects and how the various facets of road traffic expression are being approached.
The focus is then turned to creating a solution. At first this consists in aggregating data
so as to create a richer context than would be present otherwise, this includes the retrieval
from different services, as well as the composition of a unique view of the same driving
situation with new dimensions added to it. And then Models were created using different
Machine Learning methods, and a comparison of results according to selected and justified
evaluation metrics was made. The compared Methods are Decision Tree, Naive Bayes, and
Support Vector Machine.
The different types of information were evaluated on their own as potential classifiers and
then were evaluated together, leading to the conclusion that the various types combined
allow for the creation of better models capable of finding problems with more confidence
in such results.
According to the tests performed the chosen approach can improve the performance
over a baseline approach and point out problematic situations with a precision of over 90%.
As expected by not using factors concerning the driver state or acceleration the scope of
problems which are detected is limited in domain. A expansão e menor custo de dispositivos eletrónicos equipados com sensores está a levar a uma maior e mais barata disponibilidade de informação localizada. O advento da internet criou fenómenos como a criação de mapas e dados relacionados gerados por comunidades. A combinação da disponibilidade de informação móvel e mapas construídos pela comunidade, em conjunto com uma obtenção de informação através da internet mais conveniente, criou a oportunidade de contextualizar os dados de novas maneiras. Este trabalho faz uso dessa oportunidade e tenta generalizar eventos de condução que são considerados problemáticos em função de factores contextuais, tais como a presença de edifícios, áreas, e comodidades na vizinhança, o clima, e a hora do dia, a semana, ou o mês. De modo a investigar esta questão, o problema é contextualizado como emergente no tópico de Cidades Inteligentes, e explorado com recurso a Fusão de Dados e a Aprendizagem Máquina. O estado da arte é exposto, através de projectos relacionados à expressão do tráfego rodoviário, dando relevo às várias facetas até então investigadas por outros autores de modo a enquadrar o trabalho presente. Dado o enquadramento e concretização do problema, é proposta uma solução. Esta solução passa por inicialmente agregar dados de modo a enriquecer o contexto, incluindo a recolha destes de vários serviços, e uma composição dos dados recolhidos numa perspectiva única referente a uma situação de condução. Após este enriquecimento dos dados, são criados modelos com base em diferentes técnicas de Aprendizagem Máquina. Os métodos utilizados são Decision Tree, Naive Bayes, e Support Vector Machine. Os resultados conseguidos com estes modelos são depois comparados de acordo com as métricas de avaliação seleccionadas. Uma comparação foi feita também com diferentes tipos de informação separadamente e também em conjunto, levando à conclusão de que os vários tipos combinados permitem a criação de melhores modelos capazes de encontrar problemas com mais confiança nos resultados produzidos. De acordo com os testes executados a abordagem escolhida consegue melhorar resultados de um modelo base e descobrir situações problemáticas de condução com uma precisão acima dos 90%. No entanto, como seria de esperar, o âmbito dos problemas detectados tem um domínio limitado aos aspectos seleccionados. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Computer Science |
URI: | https://hdl.handle.net/1822/47696 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Artur Filipe Freitas Quintas.pdf | 7,45 MB | Adobe PDF | View/Open |