Resumo:
A área de análise de sentimentos estuda as opiniões das pessoas sobre uma determinada entidade. O principal objetivo desta área é encontrar o sentimento (positivo, negativo ou neutro) em documentos, frases e opiniões. Com o interesse crescente pela análise de sentimentos, várias empresas já possuem ferramentas desenvolvidas internamente, e muitas startups foram criadas para desenvolver soluções com foco na mineração de opiniões. Este trabalho apresenta um framework desenvolvido na linguagem Java que utiliza técnicas de processamento de linguagem natural para extrair opiniões de comentários e gerar sumários destas opiniões. O framework faz uso de POSTaggers (Part-of-Speech Taggers), listas de stopwords e bases léxicas. Para um melhor desempenho do framework, as bases léxicas e listas de stopwords foram transformadas em árvores Trie, que possuem um algoritmo de busca de complexidade O(1). O módulo de extração de características disponibilizado na ferramenta permite ao usuário definir heurísticas, tornando possível avaliar e selecionar as melhores heurísticas de acordo com o foco de uso do framework. A ferramenta desenvolvida permite a realização das etapas da análise de sentimento: extração de características e opiniões, classificação de sentimentos e sumarização de opiniões. Foi realizado um estudo de caso para avaliar o módulo de classificação de sentimentos. Os testes demonstraram que o framework possui resultados comparáveis aqueles encontrados na literatura. O framework _e independente de contexto e pode ser configurado para qualquer idioma, sendo necessário que o usuário forneça alguns arquivos de configuração, e uma lista de heurísticas de acordo com o idioma desejado.