Publicação
Computer Vision on the Edge
| Resumo: | Dado o crescimento ao longo dos anos nas capacidades de processamento de CPU e GPU eos avanços feitos na área de Deep Learning, é possível desenvolver modelos e arquiteturasde visão computacional mais complexos. Algoritmos de visão computacional estão presentese em execução em vários dispositivos e dispositivos do nosso dia-à-dia, desde carrosautónomos até o reconhecimento facial em smartphones.O objetivo deste trabalho passa por implementar uma solução eficiente que, através do usode Redes Neuronais Convolucionais e técnicas de Deep Learning, seja capaz de identificar eclassificar veículos com bom desempenho. A solução deve ser capaz de correr num EdgeHardware Device a ser colocado no SmartLamppost da Ubiwhere, um poste de luz que podeconter diferentes módulos, como câmeras e edge nodes capazes de processar dados. Será útil em tarefas como contagem e classificação de veículos que passam por uma determinadaárea, usando o feed de vídeo das câmeras.Para atingir este objetivo, diferentes abordagens foram seguidas para desenvolver o modelofinal. Desde a criação e optimização de um modelo, para a utilização de modelos pré treinados. A escolha final foi de uma estrutura de One-Stage Detectors, otimizados paravelocidade em dispositivos móveis. Como resultado, o modelo final obteve bons resultadosque alcançaram 39.36 % de mAP no dataset COCO e bons valores de inferência nodispositivo de edge.Este documento também apresenta um estudo do estado da arte na detecção e classificaçãode objetos em geral e, especificamente, sobre os diferentes modelos de detecção de objetos mais adequados para a detecção em tempo real. |
|---|---|
| Autores principais: | Semitela, António Filipe Correia |
| Assunto: | Visão Computacional Deteção de Objectos Redes Neuronais de Convolução Redes Neuronais Profundas Computer Vision Deep Neural Networks Convolution Neural Networks Object Detection |
| Ano: | 2021 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Coimbra |
| Idioma: | inglês |
| Origem: | Estudo Geral - Universidade de Coimbra |
| Resumo: | Dado o crescimento ao longo dos anos nas capacidades de processamento de CPU e GPU eos avanços feitos na área de Deep Learning, é possível desenvolver modelos e arquiteturasde visão computacional mais complexos. Algoritmos de visão computacional estão presentese em execução em vários dispositivos e dispositivos do nosso dia-à-dia, desde carrosautónomos até o reconhecimento facial em smartphones.O objetivo deste trabalho passa por implementar uma solução eficiente que, através do usode Redes Neuronais Convolucionais e técnicas de Deep Learning, seja capaz de identificar eclassificar veículos com bom desempenho. A solução deve ser capaz de correr num EdgeHardware Device a ser colocado no SmartLamppost da Ubiwhere, um poste de luz que podeconter diferentes módulos, como câmeras e edge nodes capazes de processar dados. Será útil em tarefas como contagem e classificação de veículos que passam por uma determinadaárea, usando o feed de vídeo das câmeras.Para atingir este objetivo, diferentes abordagens foram seguidas para desenvolver o modelofinal. Desde a criação e optimização de um modelo, para a utilização de modelos pré treinados. A escolha final foi de uma estrutura de One-Stage Detectors, otimizados paravelocidade em dispositivos móveis. Como resultado, o modelo final obteve bons resultadosque alcançaram 39.36 % de mAP no dataset COCO e bons valores de inferência nodispositivo de edge.Este documento também apresenta um estudo do estado da arte na detecção e classificaçãode objetos em geral e, especificamente, sobre os diferentes modelos de detecção de objetos mais adequados para a detecção em tempo real. |
|---|