Publicação
Parallel, angular and perpendicular parking for autonomously driven vehicles
| Resumo: | O progresso para criar um veículo completamente autónomo tem aumentado constantemente nas últimas décadas e por consequência, o estacionamento autónomo tem sido uma área bas tante investigada, uma vez que todas as viagem de carro têm de terminar com uma manobra de estacionamento. Nos últimos anos, com o recente sucesso da Aprendizagem por Reforço, a ideia de aplicar esta tecnologia para resolver o problema do estacionamento autónomo tem sido cada vez mais explorada. Um veículo equipado com sistema de estacionamento autónomo tem de estacionar em três tipos de lugares de estacionamento, perpendicular, angular e paralelo. Qualquer sistema de estacionamento autónomo visa controlar o ângulo de direção e a velocidade do veículo, tendo em consideração o estado do ambiente para garantir uma manobra sem colisões dentro do es paço disponível. Assim, nesta dissertação, são apresentados dois métodos que visam resolver o problema do estacionamento autónomo para os três tipos de lugares de estacionamento, per pendicular, angular e paralelo, utilizando a Aprendizagem por Reforço. Nesta dissertação, para cada método implementado é apresentada uma extensa explicação do método com a respectiva função de recompensa. A construção do ambiente e do agente no CopppeliaSim são apresentados juntamente com as configurações da implementação de ROS que é responsável por estabelecer a comunicação entre o CopppeliaSim e o Python script onde o algoritmo de Aprendizagem por Reforço foi implementado. O algoritmo de Aprendizagem por Reforço implementado foi o Deep Deterministic Policy Gradient (DDPG). Para os dois métodos, muitos treinos foram realizados para encontrar os hiperparâmetros ideais. O treino final e to das as etapas intermédias tambem são apresentadas. Por fim, foi realizada uma análise do comportamento do agente em todos os testes. |
|---|---|
| Autores principais: | Sousa, Bruno António Rodrigues |
| Assunto: | Inteligência artificial Aprendizagem máquina Aprendizagem por reforço Robô móvel autónomo Robótica Estacionamento autónomo DDPG Artificial intelligence Machine Learning Reinforcement learning Autonomous mobile robot Robotics Autonomous parking |
| Ano: | 2022 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | inglês |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | O progresso para criar um veículo completamente autónomo tem aumentado constantemente nas últimas décadas e por consequência, o estacionamento autónomo tem sido uma área bas tante investigada, uma vez que todas as viagem de carro têm de terminar com uma manobra de estacionamento. Nos últimos anos, com o recente sucesso da Aprendizagem por Reforço, a ideia de aplicar esta tecnologia para resolver o problema do estacionamento autónomo tem sido cada vez mais explorada. Um veículo equipado com sistema de estacionamento autónomo tem de estacionar em três tipos de lugares de estacionamento, perpendicular, angular e paralelo. Qualquer sistema de estacionamento autónomo visa controlar o ângulo de direção e a velocidade do veículo, tendo em consideração o estado do ambiente para garantir uma manobra sem colisões dentro do es paço disponível. Assim, nesta dissertação, são apresentados dois métodos que visam resolver o problema do estacionamento autónomo para os três tipos de lugares de estacionamento, per pendicular, angular e paralelo, utilizando a Aprendizagem por Reforço. Nesta dissertação, para cada método implementado é apresentada uma extensa explicação do método com a respectiva função de recompensa. A construção do ambiente e do agente no CopppeliaSim são apresentados juntamente com as configurações da implementação de ROS que é responsável por estabelecer a comunicação entre o CopppeliaSim e o Python script onde o algoritmo de Aprendizagem por Reforço foi implementado. O algoritmo de Aprendizagem por Reforço implementado foi o Deep Deterministic Policy Gradient (DDPG). Para os dois métodos, muitos treinos foram realizados para encontrar os hiperparâmetros ideais. O treino final e to das as etapas intermédias tambem são apresentadas. Por fim, foi realizada uma análise do comportamento do agente em todos os testes. |
|---|