DSpace/Manakin Repository

Sumarizador de avaliações usando textrank e modelagem de tópicos

Mostrar registro simples

dc.creator TAKENAKA, Fernando Hideki
dc.date.issued 2023-08-30
dc.identifier.uri https://repositorio.unifei.edu.br/jspui/handle/123456789/3936
dc.description.abstract Over the past decade, the Internet has changed the way people work, shop and socialize. Those changes resulted in the increase of User Generated Content (UGC) such as: ratings, reviews, wikis, and videos. UCG contains relevant information for decision-making, especially with regard to the acquisition of goods and services. However, the large volume and dispersion of this content makes it difficult to obtain relevant information. Text summarization appears as a way to make this content more accessible to people. A summary A can be considered better than another B when A is shorter than B while maintaining the same content relevance, or when A, despite being longer, presents more relevant content. Analyzing the literature, we observed that it is possible to produce better quality summaries than those produced by algorithms that correspond to the state of the art in text summarization. We present a multilingual automatic text summarizer that combines and extends the algorithms Latent Dirichlet Allocation (LDA) and TextRank. Our approach, when compared to the state of the art, generates better text summaries in terms of size and content relevance. pt_BR
dc.language por pt_BR
dc.publisher Universidade Federal de Itajubá pt_BR
dc.rights Acesso Aberto pt_BR
dc.subject Processamento de linguagem natural pt_BR
dc.subject Textrank pt_BR
dc.subject Modelagem de tópicos pt_BR
dc.subject Sumarização pt_BR
dc.title Sumarizador de avaliações usando textrank e modelagem de tópicos pt_BR
dc.type Dissertação pt_BR
dc.date.available 2023-11-09
dc.date.available 2023-11-09T12:55:18Z
dc.date.accessioned 2023-11-09T12:55:18Z
dc.creator.Lattes http://lattes.cnpq.br/3526783571774290 pt_BR
dc.contributor.advisor1 BALDOCHI JUNIOR, Laércio Augusto
dc.contributor.advisor1Lattes http://lattes.cnpq.br/8734341450513549 pt_BR
dc.description.resumo Na última década a Internet mudou o modo como as pessoas trabalham, fazem compras e se socializam. Essas mudanças resultaram em um aumento no Conteúdo Gerado pelos Usuários (CGU) como, por exemplo: avaliações, notas, artigos e vídeos. Os CGUs possuem informações relevantes para a tomada de decisão, especialmente no que se refere à aquisição de bens e serviços. Entretanto, o grande volume e dispersão deste conteúdo torna difícil a obtenção de informações relevantes. Neste contexto, a sumarização de textos é apresentada como um modo de tornar este conteúdo mais acessível às pessoas. Um dado sumário A pode ser considerado melhor que um outro sumário B se o primeiro for mais curto que o segundo com o mesmo conteúdo, ou quando mesmo sendo mais longo, possui mais informações relevantes. Analisando a literatura disponível, foi constatado que é possível produzir sumários de melhor qualidade do que aqueles que correspondem ao estado da arte em sumarização de textos. Neste trabalho, apresentamos um sumarizador automático multilingual que combina e expande os algoritmos Latent Dirichlet Allocation (LDA) e TextRank. Em comparação com o estado da arte, este trabalho gerou sumários melhores em termos de tamanho e conteúdo. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação pt_BR
dc.publisher.program Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação pt_BR
dc.publisher.initials UNIFEI pt_BR
dc.subject.cnpq CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.relation.references TAKENAKA, Fernando Hideki. Sumarizador de avaliações usando textrank e modelagem de tópicos. 2023. 67 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itabira, 2023. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples