DSpace/Manakin Repository

Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira

Mostrar registro simples

dc.creator RIBEIRO, Caio Tertuliano
dc.date.issued 2026-02-19
dc.identifier.citation RIBEIRO, Caio Tertuliano. Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira. 2026. 153 f. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal de Itajubá, Itajubá, 2026. pt_BR
dc.identifier.uri https://repositorio.unifei.edu.br/jspui/handle/123456789/4372
dc.description.abstract Hyperparameter tuning is decisive for both predictive performance and computational cost in machine learning models. In binary classification with Extreme Gradient Boosting, tuning is inherently multiobjective: predictive quality must be maximized while execution time is minimized. This work proposes a methodological framework that integrates Design of Experiments, Response Surface Methodology, Factor Analysis, and the Normal Boundary Intersection method to guide the selection of Extreme Gradient Boosting hyperparameters under a fixed evaluation budget. The initial exploration is conducted through a fractional facecentered central composite design, totaling 88 configurations. The observed responses (accuracy, precision, recall, specificity, and runtime) are collected under a reproducible protocol and summarized through factor scores obtained via principal component analysis with Varimax rotation. These scores define quality and cost objective functions, reduce redundancy among metrics, and support an interpretable assessment of trade-offs. Quadratic responsesurface models are then fitted to the objective functions and used by Normal Boundary Intersection to sample an approximately uniform Pareto frontier; candidate solutions are reevaluated on the real model, and a final compromise configuration is selected. The proposed approach is benchmarked, under equivalent evaluation budgets, against grid search, random search, Bayesian optimization, and Hyperopt. Results show substantial computational savings: the method achieves an average runtime of 0.078 s per fold and an average total runtime of 158 s, reducing total time by 9% to 71% relative to the benchmarks while maintaining high and stable predictive performance across replications. As external validation, the proposed pipeline was replicated on two additional datasets with contrasting profiles (balanced and highly imbalanced), reproducing the cost–quality trade-off observed in the canonical benchmark and reinforcing the multivariate stability of the method. Overall, integrating Design of Experiments and Normal Boundary Intersection provides a parsimonious, interpretable, and replicable alternative for multiobjective hyperparameter tuning, with potential applicability to other Gradient Boosting Decision Tree families and cost-constrained settings. pt_BR
dc.language por pt_BR
dc.publisher Universidade Federal de Itajubá pt_BR
dc.rights Acesso Aberto pt_BR
dc.subject Otimização de hiperparâmetros pt_BR
dc.subject Planejamento de experimentos pt_BR
dc.subject Superfície de resposta pt_BR
dc.subject Otimização multiobjetivo pt_BR
dc.subject Interseção normal à fronteira pt_BR
dc.subject Extreme Gradient Boosting pt_BR
dc.title Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira pt_BR
dc.type Dissertação pt_BR
dc.date.available 2026-03-15
dc.date.available 2026-04-15T13:51:48Z
dc.date.accessioned 2026-04-15T13:51:48Z
dc.creator.Lattes http://lattes.cnpq.br/3087349766668094 pt_BR
dc.contributor.advisor1 PAIVA, Anderson Paulo de
dc.contributor.advisor1Lattes http://lattes.cnpq.br/4728106898297335 pt_BR
dc.description.resumo A calibração de hiperparâmetros é decisiva para o desempenho preditivo e o custo computacional de modelos de aprendizagem de máquina. Em classificação binária com Extreme Gradient Boosting, esse ajuste é inerentemente multiobjetivo: busca-se maximizar a qualidade preditiva e, simultaneamente, minimizar o tempo de execução. Este trabalho propõe um arcabouço metodológico que integra Planejamento de Experimentos, Metodologia de Superfície de Resposta, Análise Fatorial e o método Interseção Normal à Fronteira para orientar a seleção de hiperparâmetros do Extreme Gradient Boosting sob um orçamento fixo de avaliações. A exploração inicial do espaço é conduzida por um delineamento composto central de face centrada fracionário, totalizando 88 configurações. As respostas (acurácia, precisão, revocação, especificidade e tempo) são obtidas sob protocolo reprodutível com replicações e sintetizadas por escores fatoriais derivados de análise de componentes principais com rotação Varimax. Esses escores permitem definir funções objetivo de qualidade e de custo, reduzindo a redundância entre métricas e favorecendo a interpretação de trade-offs. Em seguida, modelos quadráticos de Metodologia de Superfície de Resposta são ajustados às funções objetivo e empregados pela Interseção Normal à Fronteira para amostrar uma fronteira de Pareto aproximadamente uniforme; as soluções candidatas são reavaliadas no modelo real e uma configuração final de compromisso é selecionada. A proposta é comparada, sob orçamento equivalente, com busca em grade, busca aleatória, otimização bayesiana e Hyperopt. Os resultados indicam redução substancial do custo computacional: o método proposto alcança tempo médio por fold de 0,078 s e tempo médio total de 158 s, com reduções de 9% a 71% no tempo total em relação aos benchmarks, mantendo desempenho preditivo elevado e estável entre réplicas. Como validação externa, o pipeline foi replicado em duas bases adicionais com perfis contrastantes (balanceada e desbalanceada), reproduzindo o padrão custo-qualidade observado no benchmark principal e reforçando a estabilidade multivariada do método. Conclui-se que a integração entre Planejamento de Experimentos e Interseção Normal à Fronteira constitui uma alternativa parcimoniosa, interpretável e replicável para calibração multiobjetivo de hiperparâmetros, com potencial de generalização para outros algoritmos da família Gradient Boosting Decision Trees e cenários com restrições de custo. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department IEPG - Instituto de Engenharia de Produção e Gestão pt_BR
dc.publisher.program Programa de Pós-Graduação: Mestrado - Engenharia de Produção pt_BR
dc.publisher.initials UNIFEI pt_BR
dc.subject.cnpq CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUÇÃO pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples