Publicação

Patologias da laringe com análise acústica vocal

Ver documento

Detalhes bibliográficos
Resumo:Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.
Autores principais:Gonçalves, André Amorim
Assunto:Frequência fundamental Jitter Shimmer Harmonic to noise ratio Patologias da laringe
Ano:2015
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Instituto Politécnico de Bragança
Idioma:português
Origem:Biblioteca Digital do IPB
Descrição
Resumo:Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.