Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/84180
Title: | Temporal object detection for autonomous driving |
Other titles: | Deteção temporal de objetos para condução autónoma |
Author(s): | Ferreira, Luís Pedro Barbosa |
Advisor(s): | Novais, Paulo Gonçalves, Filipe |
Keywords: | Condução autónoma Deteção de objetos Inteligência artificial Aprendizagem profunda Perceção máquina LiDAR Nuvens de pontos Multi-frame Autonomous driving Object detection Artificial intelligence Deep Learning Machine perception Point clouds |
Issue date: | 13-Dec-2022 |
Abstract(s): | A Inteligência Artificial tem sido cada vez mais utilizada nas nossas tarefas diárias, melhorando a
qualidade de vida e a segurança das pessoas. A condução autónoma é um dos campos onde esta inteligência está a ser cada vez mais utilizada. Este processo envolve a transformação de veículos normalmente
conduzidos por humanos em veículos autônomos com capacidade de agir sem intervenção humana.
A condução autónoma pode usar dados de vários sensores, como câmaras, RADAR e/ou LiDAR, para
percecionar automaticamente o ambiente ao redor e tomar decisões inteligentes. Para compreender o
ambiente percecionado, um módulo de deteção de objetos deve ser desenvolvido e interconectado para
uma implementação confiável de um veículo autónomo. Essa tarefa é a base da condução autónomo,
pois permite que o veículo reconheça objetos que possam estar presentes na área envolvente, tais como
pedestres ou outros veículos. As deteções geralmente são feitas usando algoritmos de Aprendizagem Profunda que utilizam redes neuronais convolucionais e grandes quantidades de dados de treino e validação.
Apesar de vários esforços para acelerar o desenvolvimento de veículos autónomos, essa tarefa tem
se mostrado complexa. Quase todas as técnicas desenvolvidas para resolver este problema foram implementadas realizando deteções em cada frame separadamente. Essa estratégia, no entanto, não aborda
questões como oclusão, ruído do sinal, ou outros tipos de falta de informação dos objetos. Como resultado, uma tecnologia consistente temporalmente que emprega as informações de um objeto num contexto
de múltiplos frames, ou seja, em uma sequência de frames, pode aumentar a qualidade da deteção.
No caso desta dissertação, a perceção autônoma será realizada usando a deteção de objetos temporal
com base em dados coletados de sensores LiDAR. Esses sensores são capazes de obter dados de alta
fidelidade que permitem uma representação 3D de alta qualidade do cenário, conhecidas como nuvens
de pontos. Artificial Intelligence has been increasingly used in our daily tasks, improving people’s quality of life and safety. Autonomous driving is one of the fields where this intelligence is increasingly being used. This process entails the transformation of vehicles normally driven by humans into autonomous vehicles with the ability to act without human intervention. Autonomous driving may use data from various sensors, such as cameras, RADAR, and/or LiDAR, to automatically perceive the surrounding environment and make intelligent decisions. To comprehend the perceived environment, an object detection module must be developed and interconnected for a reliable autonomous vehicle implementation. This task is the foundation of autonomous driving since it allows the vehicle to recognise objects who may be present in the area, such as pedestrians or other vehicles. The detections are usually made using Deep Learning algorithms that utilise convolutional neural networks and massive amounts of training data. Despite several efforts to accelerate the development of autonomous vehicles, this task has proven to be complex. Almost all developed techniques to solve this problem have been implemented by performing detections on each frame separately. This strategy, however, does not address issues like occlusion or other sorts of object information deficiency. As a result, a temporal consistent technology that employs an object’s information in a multi-frame context, that is, in a sequence of frames, can increase detection quality. In the instance of this dissertation, autonomous perception will be accomplished using temporal object detection based on data collected from LiDAR sensors. These sensors are capable of obtaining high-fidelity data that allows for a high-quality 3D representation of the scenario, known as point clouds. |
Type: | Master thesis |
Description: | Dissertação de mestrado integrado em Informatics Engineering |
URI: | https://hdl.handle.net/1822/84180 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Luis Pedro Barbosa Ferreira.pdf | 10,4 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License