Publicação
PRO-GMÁTICA: uma base de dados prosódica pragmaticamente orientada em Português Europeu
| Resumo: | Neste trabalho apresenta-se uma base de dados de fala espontânea com etiquetagem linguística, prosódica e pragmática em Português Europeu (PE). Esta informação pode ser encontrada num ficheiro de texto que é associado ao sinal de fala, sendo por isso possível analisar simultaneamente as várias dimensões em questão. O objectivo deste trabalho consiste em criar um corpus de fala etiquetado em que seja possível correlacionar a dimensão acústica e prosódica do sinal com o seu significado linguístico e pragmático, sobretudo tendo em atenção as dimensões emocionais e estilísticas do discurso. Constituem motivações subjacentes a este trabalho a necessidade de controlar a manipular a naturalidade da fala sintética, a necessidade de implementar emoção e atitude nos actuais sistemas síntese e reconhecimento de fala e a inexistência de corpora de fala espontânea linguística e prosodicamente etiquetada e que contemple as dimensões emocional e comunicativa. Neste artigo, faz-se uma breve introdução ao assunto em questão e apresenta-se o estado-da-arte das bases de dados em PE. Em seguida, descreve-se o processo da recolha da PRO-GMÁTICA e os critérios subjacentes à sua estruturação. Posteriormente, refere-se o tratamento e análise dos dados recolhidos, o que consiste basicamente no elenco e descrição dos níveis de etiquetagem considerados e na extracção dos parâmetros acústicos segundo o modelo Fujisaki. Finalmente, apresentam-se as conclusões e trabalhos futuros. Desta forma, pretendemos, num futuro próximo, vir a dotar os sistemas de síntese da fala e de diálogo homem-máquina em PE de uma dimensão mais pragmática. |
|---|---|
| Autores principais: | Braga, Daniela |
| Outros Autores: | Teixeira, João Paulo; Coelho, Luís; Freitas, Diamantino Silva |
| Assunto: | Base de dados Pragmática |
| Ano: | 2005 |
| País: | Portugal |
| Tipo de documento: | comunicação em conferência |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Instituto Politécnico de Bragança |
| Idioma: | português |
| Origem: | Biblioteca Digital do IPB |
| Resumo: | Neste trabalho apresenta-se uma base de dados de fala espontânea com etiquetagem linguística, prosódica e pragmática em Português Europeu (PE). Esta informação pode ser encontrada num ficheiro de texto que é associado ao sinal de fala, sendo por isso possível analisar simultaneamente as várias dimensões em questão. O objectivo deste trabalho consiste em criar um corpus de fala etiquetado em que seja possível correlacionar a dimensão acústica e prosódica do sinal com o seu significado linguístico e pragmático, sobretudo tendo em atenção as dimensões emocionais e estilísticas do discurso. Constituem motivações subjacentes a este trabalho a necessidade de controlar a manipular a naturalidade da fala sintética, a necessidade de implementar emoção e atitude nos actuais sistemas síntese e reconhecimento de fala e a inexistência de corpora de fala espontânea linguística e prosodicamente etiquetada e que contemple as dimensões emocional e comunicativa. Neste artigo, faz-se uma breve introdução ao assunto em questão e apresenta-se o estado-da-arte das bases de dados em PE. Em seguida, descreve-se o processo da recolha da PRO-GMÁTICA e os critérios subjacentes à sua estruturação. Posteriormente, refere-se o tratamento e análise dos dados recolhidos, o que consiste basicamente no elenco e descrição dos níveis de etiquetagem considerados e na extracção dos parâmetros acústicos segundo o modelo Fujisaki. Finalmente, apresentam-se as conclusões e trabalhos futuros. Desta forma, pretendemos, num futuro próximo, vir a dotar os sistemas de síntese da fala e de diálogo homem-máquina em PE de uma dimensão mais pragmática. |
|---|