Publication

Tracking 3D de objetos deformáveis em tempo real

View document

Bibliographic Details
Summary:O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real.
Main Authors:Silva, Tiago Miguel da Cunha
Subject:Machine/Deep Learning RGB-D Tracking-3D
Year:2022
Country:Portugal
Document type:master thesis
Access type:open access
Associated institution:Universidade do Minho
Language:Portuguese
Origin:RepositóriUM - Universidade do Minho
Description
Summary:O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real.