Document details

Deteção e acompanhamento de movimento através de uma câmara de vídeo

Author(s): Peixoto, Pedro Tiago da Cruz

Date: 2012

Persistent ID: http://hdl.handle.net/10400.22/3259

Origin: Repositório Científico do Instituto Politécnico do Porto

Subject(s): Tracking; Camshift; "Classificadores haar"; Vídeo digital; Raspberry pi; "Haar classifiers"; Digital video


Description

A deteção e seguimento de pessoas tem uma grande variedade de aplicações em visão computacional. Embora tenha sido alvo de anos de investigação, continua a ser um tópico em aberto, e ainda hoje, um grande desafio a obtenção de uma abordagem que inclua simultaneamente exibilidade e precisão. O trabalho apresentado nesta dissertação desenvolve um caso de estudo sobre deteção e seguimento automático de faces humanas, em ambiente de sala de reuniões, concretizado num sistema flexível de baixo custo. O sistema proposto é baseado no sistema operativo GNU's Not Unix (GNU) linux, e é dividido em quatro etapas, a aquisição de vídeo, a deteção da face, o tracking e reorientação da posição da câmara. A aquisição consiste na captura de frames de vídeo das três câmaras Internet Protocol (IP) Sony SNC-RZ25P, instaladas na sala, através de uma rede Local Area Network (LAN) também ele já existente. Esta etapa fornece os frames de vídeo para processamento à detecção e tracking. A deteção usa o algoritmo proposto por Viola e Jones, para a identificação de objetos, baseando-se nas suas principais características, que permite efetuar a deteção de qualquer tipo de objeto (neste caso faces humanas) de uma forma genérica e em tempo real. As saídas da deteção, quando é identificado com sucesso uma face, são as coordenadas do posicionamento da face, no frame de vídeo. As coordenadas da face detetada são usadas pelo algoritmo de tracking, para a partir desse ponto seguir a face pelos frames de vídeo subsequentes. A etapa de tracking implementa o algoritmo Continuously Adaptive Mean-SHIFT (Camshift) que baseia o seu funcionamento na pesquisa num mapa de densidade de probabilidade, do seu valor máximo, através de iterações sucessivas. O retorno do algoritmo são as coordenadas da posição e orientação da face. Estas coordenadas permitem orientar o posicionamento da câmara de forma que a face esteja sempre o mais próximo possível do centro do campo de visão da câmara. Os resultados obtidos mostraram que o sistema de tracking proposto é capaz de reconhecer e seguir faces em movimento em sequências de frames de vídeo, mostrando adequabilidade para aplicação de monotorização em tempo real.

The detection and tracking of people have a wide variety of applications in computer vision. Although it has been the target of research for several years, it remains a open topic. It still remains a great challenge to get an approach that includes both exibility and accuracy, specially when it comes to an open environment. The work presented in this thesis, develops a case study on detection and automatic tracking of human faces in a meeting room environment, implemented in a exible low cost system. The proposed system is based on GNU Linux operating system, and divided in four stages: the video acquisition, face detection, face tracking and reorientation of the camera position. Video acquisition consists in capturing frames from an existing video IP cameras Sony SNC-RZ25P, installed in the meeting room via a LAN. This step provides the frames to the detection processing and when finished, to the tracking processing step. The detection uses the algorithm proposed by Viola and Jones, to identify objects based on their main features, and allows performing the detection of any type of object, in this case an human face, generally in real time. The output of this detection, if successfully identified one or more faces, are the position coordinates of the face in the video frame, which is then used by the tracking algorithm, to follow the face, from this point, in subsequent frames. In the tracking, the CamShift algorithm that bases its operation on search, in a probability density map representing the human face, and compute its maximum value through successive iterations. The return of the algorithm, are the position coordinates, and orientation of the human face, which allows positioning the camera so that the face is always nearest the center of the camera view field. The results shown that the proposed tracking system is able to recognize and track faces in motion in video frames sequences, showing its ability for real time aplications.

Document Type Master thesis
Language Portuguese
Advisor(s) Figueiredo, Lino; Meireles, António José Matos
Contributor(s) Repositório Científico do Instituto Politécnico do Porto
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents