Use este identificador para citar ou linkar para este item:
https://repositorio.unifei.edu.br/jspui/handle/123456789/1481
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | ARAGÃO, Marcelo Vinícius Cysneiros | - |
dc.date.issued | 2018-06-15 | - |
dc.identifier.citation | ARAGÃO, Marcelo Vinícius Cysneiros. Estudo e avaliação de classificadores para um sistema anti-spam. 2018. 145 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação) – Universidade Federal de Itajubá, Itajubá, 2018. | pt_BR |
dc.identifier.uri | https://repositorio.unifei.edu.br/jspui/handle/123456789/1481 | - |
dc.description.abstract | O advento das redes de dados móveis vem popularizando o acesso à Internet, aumentando o número de usuários e o volume de troca de e-mails. Desde 2005, porém, pelo menos metade deste tráfego é composto por spam, ou seja, mensagens não-solicitadas enviadas em massa a fim de promover um produto ou serviço, podendo incluir anúncios, esquemas de pirâmide, doações, correntes, entre outros. Este tráfego massivo de mensagens indesejadas traz prejuízos aos usuários, tais como o uso excessivo e desnecessário da largura de banda, impacto ambiental, perda de produtividade, exposição de conteúdo impróprio a públicos sensíveis, prejuízos financeiros e legais e redução da efetividade de propagandas legítimas. Uma técnica largamente empregada por servidores de e-mail, a fim de lidar com este problema são as listas negras, um banco de dados em tempo real que determina se um endereço IP está enviando e-mails que podem ser considerados spam. Este tipo de sistema apresenta desvantagens, tais como código proprietário, parcialidade questionável, limitações dos protocolos IPv4/IPv6 e lentidão na classificação. Outra abordagem ao problema de classificação de e-mails consiste em usar os dados contidos nas próprias mensagens e um modelo de aprendizado de máquina, a fim de construir um sistema de decisão automático, inteligente, imparcial e adaptativo, capaz de identificar padrões e se adaptar às características comuns a ambos os tipos de e-mail, apresentando alta precisão de classificação. Portanto, o objetivo deste trabalho é o estudo e a aplicação de métodos de aprendizado de máquina à classificação de e-mails, a fim de obter modelos utilizáveis em sistemas anti-spam do mundo real. Para isto, são também abordadas técnicas de seleção de características e redução de dimensionalidade, necessária e complementar, respectivamente, ao pré-processamento dos dados utilizados pelos algoritmos. Após realizar experimentos em diversos corpora, os resultados confirmaram que modelos de aprendizado de máquina, aliados a métodos de seleção de características baseados em informação mútua e às técnicas de redução de dimensionalidade por correlação, podem ser aplicados com sucesso à categorização de e-mails, detectando spams com alto grau de confiabilidade para o usuário. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.title | Estudo e avaliação de classificadores para um sistema anti-spam. | pt_BR |
dc.type | Dissertação | pt_BR |
dc.place | Itajubá | pt_BR |
dc.pages | 145 p. | pt_BR |
dc.keywords.portuguese | Aprendizado de máquina | pt_BR |
dc.keywords.portuguese | Categorização de texto | pt_BR |
dc.keywords.portuguese | Anti-spam | pt_BR |
dc.keywords.english | Machine learning | pt_BR |
dc.keywords.english | Text categorization | pt_BR |
dc.keywords.english | Anti-spam | pt_BR |
dc.orientador.principal | CARPINTEIRO, Otávio Augusto Salgado | - |
dc.orientador.coorientador | MOREIRA, Edmilson Marmo | - |
dc.place.presentation | Universidade Federal de Itajubá | pt_BR |
dc.pg.programa | Ciência e Tecnologia da Computação | pt_BR |
dc.pg.area | Sistemas de Computação | pt_BR |
dc.date.available | 2018-07-19T13:05:00Z | - |
dc.date.accessioned | 2018-07-19T13:05:00Z | - |
dc.publisher.department | IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação | - |
dc.publisher.program | Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação | - |
Aparece nas coleções: | Dissertações |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
dissertacao_2018086.pdf | 3,97 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.