Publicação

Tracking 3D de objetos deformáveis em tempo real

Ver documento

Detalhes bibliográficos
Resumo:O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real.
Autores principais:Silva, Tiago Miguel da Cunha
Assunto:Machine/Deep Learning RGB-D Tracking-3D
Ano:2022
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade do Minho
Idioma:português
Origem:RepositóriUM - Universidade do Minho
Descrição
Resumo:O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real.