Publicação
Tracking 3D de objetos deformáveis em tempo real
| Resumo: | O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real. |
|---|---|
| Autores principais: | Silva, Tiago Miguel da Cunha |
| Assunto: | Machine/Deep Learning RGB-D Tracking-3D |
| Ano: | 2022 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | O tracking 3D de objetos é um tópico que tem sido amplamente estudado há vários anos. Apesar de já existirem diversas soluções robustas para tracking de objetos rígidos, quando se trata de objetos de formáveis o problema aumenta de complexidade. Nos últimos anos, tem-se assistido a um aumento da utilização de técnicas de Machine/Deep Learning para resolver problemas da área da visão por computa dor, incluindo o tracking 3D de objetos. Por outro lado, têm surgido diversos dispositivos de baixo custo (do género da Kinect) que permitem obter imagens RGB-D, as quais, além da informação de cor, con têm informação de profundidade. Nesta dissertação pretendeu-se estudar, desenvolver e implementar abordagens de tracking 3D de objetos deformáveis que recorram a técnicas de Machine/Deep Learning e tenham como input imagens RGB-D. Foi realizada uma abordagem de Deep Learning para o tracking do objeto deformável onde é utilizada uma arquitetura U-NET. Os testes realizados têm por base dois datasets e obteve-se resultados satisfatórios (IOU>0.8) em ambos os datasets. Para além disso, o tracking 3D é realizado em tempo real. |
|---|