Resumo:
A Teoria dos Conjuntos Aproximados (TCA) trata, basicamente, da extração de conhecimento em bases de dados e torna possível a elaboração de modelos que auxiliem na tomada de decisões. O problema é que essas bases de dados muitas vezes possuem atributos contínuos sendo necessária a discretização desses antes da aplicação das técnicas da TCA. Os métodos clássicos realizam discretizações sem considerar a relação entre os atributos. Isso pode impedir a discretização consistente dificultando a identificação de informações supérfluas e impossibilitando a redução do volume de informações, como também pode inibir a obtenção de regras. Este trabalho apresenta um método de discretização de atributos contínuos utilizando Algoritmos Genéticos (AG). Os AG´s são utilizados para determinar os pontos de corte de cada atributo e obter uma discretização consistente. Nenhum método determinístico é utilizado para gerar pontos de corte para a população inicial, bem como qualquer outro tipo de préprocessamento do Sistema de Informação não discretizado. A população inicial é gerada aleatoriamente e, após gerações, evolui para soluções válidas. Os resultados obtidos mostram a efetividade do método de discretização proposto na aplicação das técnicas da TCA quando comparados com outros métodos de discretização.