Resumo:
Problemas de classificação estão presentes em diversas áreas do conhecimento. Para explorá-los e avaliá-los, diferentes metodologias podem ser utilizadas. Este trabalho busca comparar a habilidade de classificação de duas destas técnicas: regressão logística e redes neurais artificiais treinadas por planejamento ou delineamento de experimentos (Design of Experiments, ou DOE). A primeira pode ser considerada como técnica padrão e já é consagrada como ferramenta de auxílio na tomada de decisões. A segunda tem sido utilizada em profusão para problemas similares e apresenta-se como alternativa à regressão logística, pois assume menos restrições de uso, apesar de exigir uma simulação computacional mais complexa. Este estudo tem como objetivo realizar uma análise comparativa de oito problemas bem sedimentados, descritos no livro Applied Logistic Regression de Hosmer, Lemeshow e Sturdivant. Para tal análise, foi calculada a área sob a curva ROC (Receiver Operating Characteristic) de cada metodologia para todos os casos. A hipótese de que as redes neurais superariam os resultados encontrados pela regressão logística foi confirmada, sendo que a média para a área sob a curva dos modelos de redes neurais foram estatisticamente superiores à média dos casos modelados por regressão logística.