Repositório UNIFEI UNIFEI - Campus 1: Itajubá PPG - Programas de Pós Graduação Dissertações
Use este identificador para citar ou linkar para este item: https://repositorio.unifei.edu.br/jspui/handle/123456789/3936
Registro completo de metadados
Campo DCValorIdioma
dc.creatorTAKENAKA, Fernando Hideki-
dc.date.issued2023-08-30-
dc.identifier.urihttps://repositorio.unifei.edu.br/jspui/handle/123456789/3936-
dc.description.abstractOver the past decade, the Internet has changed the way people work, shop and socialize. Those changes resulted in the increase of User Generated Content (UGC) such as: ratings, reviews, wikis, and videos. UCG contains relevant information for decision-making, especially with regard to the acquisition of goods and services. However, the large volume and dispersion of this content makes it difficult to obtain relevant information. Text summarization appears as a way to make this content more accessible to people. A summary A can be considered better than another B when A is shorter than B while maintaining the same content relevance, or when A, despite being longer, presents more relevant content. Analyzing the literature, we observed that it is possible to produce better quality summaries than those produced by algorithms that correspond to the state of the art in text summarization. We present a multilingual automatic text summarizer that combines and extends the algorithms Latent Dirichlet Allocation (LDA) and TextRank. Our approach, when compared to the state of the art, generates better text summaries in terms of size and content relevance.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Itajubápt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectTextrankpt_BR
dc.subjectModelagem de tópicospt_BR
dc.subjectSumarizaçãopt_BR
dc.titleSumarizador de avaliações usando textrank e modelagem de tópicospt_BR
dc.typeDissertaçãopt_BR
dc.date.available2023-11-09-
dc.date.available2023-11-09T12:55:18Z-
dc.date.accessioned2023-11-09T12:55:18Z-
dc.creator.Latteshttp://lattes.cnpq.br/3526783571774290pt_BR
dc.contributor.advisor1BALDOCHI JUNIOR, Laércio Augusto-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8734341450513549pt_BR
dc.description.resumoNa última década a Internet mudou o modo como as pessoas trabalham, fazem compras e se socializam. Essas mudanças resultaram em um aumento no Conteúdo Gerado pelos Usuários (CGU) como, por exemplo: avaliações, notas, artigos e vídeos. Os CGUs possuem informações relevantes para a tomada de decisão, especialmente no que se refere à aquisição de bens e serviços. Entretanto, o grande volume e dispersão deste conteúdo torna difícil a obtenção de informações relevantes. Neste contexto, a sumarização de textos é apresentada como um modo de tornar este conteúdo mais acessível às pessoas. Um dado sumário A pode ser considerado melhor que um outro sumário B se o primeiro for mais curto que o segundo com o mesmo conteúdo, ou quando mesmo sendo mais longo, possui mais informações relevantes. Analisando a literatura disponível, foi constatado que é possível produzir sumários de melhor qualidade do que aqueles que correspondem ao estado da arte em sumarização de textos. Neste trabalho, apresentamos um sumarizador automático multilingual que combina e expande os algoritmos Latent Dirichlet Allocation (LDA) e TextRank. Em comparação com o estado da arte, este trabalho gerou sumários melhores em termos de tamanho e conteúdo.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentIESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computaçãopt_BR
dc.publisher.initialsUNIFEIpt_BR
dc.subject.cnpqCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.relation.referencesTAKENAKA, Fernando Hideki. Sumarizador de avaliações usando textrank e modelagem de tópicos. 2023. 67 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itabira, 2023.pt_BR
Aparece nas coleções:Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_2023141.pdf683,89 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.