Document details

Text mining: análise de sentimentos na classificação de notícias

Author(s): Gomes, Helder Joaquim Carvalheira

Date: 2013

Persistent ID: http://hdl.handle.net/10362/9182

Origin: Repositório Institucional da UNL

Subject(s): Análise de Sentimentos; Análise de Opinião; Text Mining; Descoberta de Conhecimento em Textos; Data Mining; Descoberta de Conhecimento em Bases de Dados; Processamento de Linguagem Natural


Description

Trabalho de Projeto apresentado como requisito parcial para obtenção do grau de Mestre em Estatística e Gestão de Informação, especialização em Gestão do Conhecimento e Inteligência de Negócio

Nos últimos anos, em consequência do aparecimento das redes sociais, a interacção entre o cliente e a empresa sofreu grandes alterações. Esta mudança, tal como outras, acarretou vantagens e desvantagens. Uma das maiores desvantagens que decorreu desta alteração é o facto de, actualmente, as organizações terem perdido o controlo sobre o que os clientes dizem acerca das mesmas, uma vez que estes facilmente publicam as suas opiniões negativas e estas são rapidamente propagadas. No entanto, algumas organizações rapidamente perceberam que poderiam retirar desta situação importantes vantagens competitivas, através da análise das opiniões que os clientes emitem sobre as mesmas, nos diversos canais. Além disso, o crescente aumento da utilização da internet permitiu também que muita informação esteja disponível online, sendo exemplo disso o facto de, actualmente, a maioria dos jornais disponibilizarem diariamente as suas publicações, nos seus sítios, na internet. Consequentemente, o volume diário de dados disponíveis na internet cresce exponencialmente e toda a informação gerada através destes poderá ser relevante, se for tratada e utilizada correctamente. É, desta forma, que surge o desafio de gerar conhecimento através desta informação, de forma automatizada. Assim, o objectivo deste trabalho consiste na construção de um modelo capaz de avaliar a polaridade (positiva, negativa ou neutra) de títulos de notícias de economia, disponíveis em endereços de RSS Feeds. Para a realização do mesmo, foi utilizado o software SAS e, por consequência, seguida toda a sua metodologia, cuja apresentação detalhada também constitui um objectivo.

In the last few years, due to the emergence of social networks, the interaction between customers and companies has experienced major changes. This change, like others, has advantages but also disadvantages. One of the major disadvantages which arose from this modification is the fact that, currently, organizations have lost control over what customers say about them, since they can easily publish their negative opinions and spread them rapidly. However, some organizations have quickly realized this situation could promote important competitive advantages, through the analysis of what customers say about them in different communication channels. Besides that, the increasing use of internet allowed that a lot of information is available online and an example of it is that, nowadays, the majority of newspapers make their publications daily available, on their websites, on the internet. Therefore, the data volume daily available on the internet grows exponentially and all of the information produced through this data might be important, if treated and used correctly. That is how the challenge of creating knowledge through this information in an automated way, emerges. Thus, the goal of this project is to build a model able to evaluate the polarity (positive, negative or neutral) of economic news headlines, available on RSS Feeds addresses. In order to do that, software SAS was used and, consequently its methodology, whose detailed description is also a goal.

Document Type Master thesis
Language Portuguese
Advisor(s) Neto, Miguel de Castro Simões Ferreira; Henriques, Roberto André Pereira
Contributor(s) RUN
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents