Author(s): Geraldes, Fernando Jorge Fernandes
Date: 2012
Persistent ID: http://hdl.handle.net/10400.11/1705
Origin: Repositório Científico do Instituto Politécnico de Castelo Branco
Author(s): Geraldes, Fernando Jorge Fernandes
Date: 2012
Persistent ID: http://hdl.handle.net/10400.11/1705
Origin: Repositório Científico do Instituto Politécnico de Castelo Branco
Relatório apresentado à Escola Superior de Tecnologia do Instituto Politécnico de Castelo Branco para cumprimento dos requisitos necessários à obtenção do grau de mestre em Desenvolvimento de Software e Sistemas Interativos.
O reconhecimento de imagens nos dias de hoje é uma prática utilizada em vários âmbitos, tais como: reconhecimento de face, reconhecimento de código de barras e QR-Code, análise de imagens médicas, entre outras. Existem também já trabalhos que pretendem explorar o reconhecimento de imagens em tempo real através da câmara de smatphones, existindo já alguns protótipos. No entanto ainda nada existe em termos de produto comercial, e o que existe neste âmbito são aplicações que reconhecem imagens mas não em tempo real, e sim a partir da imagem captada por fotografia. Este projeto está dividido em 5 capítulos, introdução onde é descrito o propósito do projeto, um estado da arte onde se apresentam outros trabalhos nesta área, os métodos estudados para o prepósito do projeto, a implementação e a criação da API e no último capítulo são apresentados os resultados, verificação da performance da solução apresentada no reconhecimento dos objetos. Por último existe um capítulo onde são apresentadas algumas conclusões. Com este projeto pretende-se que o smartphone seja capaz de reconhecer imagens em tempo real, para que possa ser útil em várias aplicações destinadas ao público em geral, mas com o objetivo fundamental que é o de poder reconhecer as imagens e poder identificá-las através de voz para ajudar pessoas invisuais no reconhecimento de objetos, ou acrescentar informação às imagens para complementar a visão humana. A implementação da aplicação consiste em desenvolver uma API para a segmentação e análise da imagem (desenvolvida em linguagem C e C++) usando bibliotecas nativas do NDK Android, OpenCV para processar imagens, que está explicada na primeira parte desta dissertação. A segunda parte é composta pela implementação de uma aplicação Android em JAVA usando o SDK, e a integração da API desenvolvida na primeira parte com a aplicação, para que o objetivo principal seja alcançado. Para alcançar os objetivos, utilizamos várias técnicas de equalização, segmentação e reconhecimento de imagens, e também foi construída uma base de conhecimento inicial para o reconhecimento de objetos. Essa base de conhecimento abarca formas geométricas básicas como triângulos, círculos, quadrados e retângulos. Esse conhecimento é mais tarde alargado com a experiência e utilização do software como a recolha de imagens (formas) não reconhecidas inicialmente. O objetivo é ter uma API que reconheça qualquer objeto previamente inserido na base de conhecimento.