Document details

Plataforma para recolha e identificação automática de espécies de pássaros utilizando registos áudio

Author(s): Cruz, Daylson de Carvalho Vera

Date: 2016

Persistent ID: http://hdl.handle.net/10400.22/10635

Origin: Repositório Científico do Instituto Politécnico do Porto

Subject(s): Classificação de sons; Data mining; Motifs; MFCC; Sound Classification; Sistemas computacionais; Sistemas computacionais; Sistemas computacionais


Description

A análise e modelação dos sons de animais com o fim de estudar a sua biodiversidade são possíveis graças a uma ciência multidisciplinar denominada bioacústica. Este trabalho tem como objetivo a construção de uma solução capaz de identificar automaticamente as espécies de pássaros através do som emitido e ainda construir uma base de dados etiquetada com base nos registos áudio colhidos. Para a classificação dos sons dos pássaros, este trabalho segue duas metodologias para a extração de atributos e recorre a tarefas do data mining. Uma das metodologias de extração de atributos baseia-se na descoberta dos padrões mais frequentes no som, denominado (Motifs). A outra metodologia bastante usada em reconhecimento de sons, baseia-se em coeficientes Mel-Frequency (MFCCs). Para a classificação são usados algoritmos de árvores de decisão e Support Vector Machines. Foram também avaliadas diferentes metodologias de pré-processamento dos sons. Para a realização das experiências, foi utilizado o dataset disponibilizado pela Neural Information Processing Scaled for Bioacustic Bird song competition (NIPS4B). Nas experiências realizadas, o processo de classificação utilizando técnicas de normalização do sinal original no pré-processamento, a extração de atributos usando a abordagem MFCCs e o algoritmo de classificação Random Forest apresentou melhores resultados. Neste trabalho foi também desenvolvida uma aplicação móvel para o sistema operativo Android capaz de gravar os sons e identifica-los utilizando os recursos da aplicação servidor (web), com um tempo médio de resposta de 20 segundos.

The analysis and modeling of animal sounds in order to study its biodiversity are possible thanks to a multidisciplinary science called bioacoustics. This work aims to build a client / server platform able to automatically identify the species of birds through the emitted sound and still build a database labeled based on the collected audio recordings. For the classification of the sounds of the birds, this work follows two methods for the extraction of attributes and uses of data mining tasks. One feature extraction methodology, is based on the discovery of the most frequent patterns in sound, called (Motifs). The other method, often used for sound recognition is based on Mel-Frequency coefficients (MFCCs). For the classification are used decision trees algorithms and Support Vector Machines. They were also evaluated different methods for pre-processing of sounds. To carry out the experiments, we used the dataset provided by the Neural Information Processing Scaled for Bioacustic Bird song competition (NIPS4B). In the experiments conducted, the classification process using normalization techniques of the original signal in the pre-processing, extracting attributes using the MFCCs approach and Random Forest classification algorithm showed the best results. This work also developed a mobile application for the operating system Android able to record sounds and identify them using the resources of the application server, with a response average time of 20 seconds.

Document Type Master thesis
Language Portuguese
Advisor(s) Gomes, Elsa Maria de Carvalho Ferreira
Contributor(s) Cruz, Daylson de Carvalho Vera
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents