Publicação

Métodos de seleção de parâmetros para o diagnóstico de patologias da laringe

Ver documento

Detalhes bibliográficos
Resumo:Esta dissertação propõe soluções para a identificação de patologias da voz através do processamento do sinal de fala. Foram utilizados na classificação de patologias como Laringite Crónica, Disfonia e Paralisia das Cordas Vocais as redes neuronais, Multilayer Perceptron e Long-Short-Term-Memory. Os parâmetros acústicos empregados foram jitter relativo, jitter absoluto, shimmer relativo, shimmer absoluto, autocorrelação, Harmonic to Noise Ratio, Noise to Harmonic Ratio e Mel Frequency Cepstral Coefficients. Estes parêmetros são extraídos da base de dados Saarbrücken Voice Database, a partir de arquivos de áudio que contém as vogais sustentadas /a/, /i/ e /u/ nos tons baixo, normal e alto. Também empregou e testou técnicas de normalização de dados, identificação de outliers e seleção de parâmetros. Tais aplicações tem a finalidade de otimizar o modelo de reconhecimento, torná-lo mais eficiente e consequentemente melhorar a acurácia/exatidão do diagnóstico. Como pré-processamento utilizou-se as técnicas de normalização Z-score, Logarítmica e Raiz Quadrada para permitir uma melhor identificação dos outliers presente nos dados, por meio da aplicação do método do Box Plot e do Desvio Padrão. Após os experimentos, tanto o método do Desvio Padrão quanto o do Box Plot com normalização do Z-score mostraram-se muito úteis para o pré-processamento do conjunto de dados para o reconhecimento de patologias de voz. A acurácia foi melhorada entre 3 a 13 pontos em percentagem. Posteriormente, foram utilizadas as técnicas de Seleção de Parâmetros que ordenam os atributos segundo uma métrica de importância. Deste modo, os parâmetros relevantes são selecionados de acordo com o critério estabelecido pelos testes: Correlação, ReliefF, Test t de Welch, Regressão Multilinear. Ao comparar todos os algoritmos desenvolvidos, pode-se destacar que o algoritmo baseado no ReliefF teve o melhor desempenho. Com relação a acurácia teve um aumento de 9 pontos percentuais e na medida F de 8 pontos percentuais.
Autores principais:Silva, Letícia
Assunto:Classificação Patologias da Voz Identificação de Outliers Seleção de Parâmetros
Ano:2020
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Instituto Politécnico de Bragança
Idioma:português
Origem:Biblioteca Digital do IPB

Registos relacionados