Publicação

Clasificación de textos en lenguaje natural usando la Wikipedia

Ver documento

Detalhes bibliográficos
Resumo:La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
Autores principais:Quinteiro-González,Jose María
Outros Autores:Martel-Jordán,Ernestina; Hernández-Morera,Pablo; Ligero-Fleitas,Juan A.; López-Rodriguez,Aaron
Assunto:Categorización de textos Wikipedia tf-idf Aprendizaje Automático Procesado de Lenguaje Natural
Ano:2011
País:Portugal
Tipo de documento:artigo
Tipo de acesso:acesso aberto
Instituição associada:Fundação para a Ciência e Tecnologia
Idioma:espanhol
Origem:SciELO Portugal
Descrição
Resumo:La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.