Use este identificador para citar ou linkar para este item:
https://repositorio.unifei.edu.br/jspui/handle/123456789/4372| Tipo: | Dissertação |
| Título: | Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira |
| Autor(es): | RIBEIRO, Caio Tertuliano |
| Primeiro Orientador: | PAIVA, Anderson Paulo de |
| Resumo: | A calibração de hiperparâmetros é decisiva para o desempenho preditivo e o custo computacional de modelos de aprendizagem de máquina. Em classificação binária com Extreme Gradient Boosting, esse ajuste é inerentemente multiobjetivo: busca-se maximizar a qualidade preditiva e, simultaneamente, minimizar o tempo de execução. Este trabalho propõe um arcabouço metodológico que integra Planejamento de Experimentos, Metodologia de Superfície de Resposta, Análise Fatorial e o método Interseção Normal à Fronteira para orientar a seleção de hiperparâmetros do Extreme Gradient Boosting sob um orçamento fixo de avaliações. A exploração inicial do espaço é conduzida por um delineamento composto central de face centrada fracionário, totalizando 88 configurações. As respostas (acurácia, precisão, revocação, especificidade e tempo) são obtidas sob protocolo reprodutível com replicações e sintetizadas por escores fatoriais derivados de análise de componentes principais com rotação Varimax. Esses escores permitem definir funções objetivo de qualidade e de custo, reduzindo a redundância entre métricas e favorecendo a interpretação de trade-offs. Em seguida, modelos quadráticos de Metodologia de Superfície de Resposta são ajustados às funções objetivo e empregados pela Interseção Normal à Fronteira para amostrar uma fronteira de Pareto aproximadamente uniforme; as soluções candidatas são reavaliadas no modelo real e uma configuração final de compromisso é selecionada. A proposta é comparada, sob orçamento equivalente, com busca em grade, busca aleatória, otimização bayesiana e Hyperopt. Os resultados indicam redução substancial do custo computacional: o método proposto alcança tempo médio por fold de 0,078 s e tempo médio total de 158 s, com reduções de 9% a 71% no tempo total em relação aos benchmarks, mantendo desempenho preditivo elevado e estável entre réplicas. Como validação externa, o pipeline foi replicado em duas bases adicionais com perfis contrastantes (balanceada e desbalanceada), reproduzindo o padrão custo-qualidade observado no benchmark principal e reforçando a estabilidade multivariada do método. Conclui-se que a integração entre Planejamento de Experimentos e Interseção Normal à Fronteira constitui uma alternativa parcimoniosa, interpretável e replicável para calibração multiobjetivo de hiperparâmetros, com potencial de generalização para outros algoritmos da família Gradient Boosting Decision Trees e cenários com restrições de custo. |
| Abstract: | Hyperparameter tuning is decisive for both predictive performance and computational cost in machine learning models. In binary classification with Extreme Gradient Boosting, tuning is inherently multiobjective: predictive quality must be maximized while execution time is minimized. This work proposes a methodological framework that integrates Design of Experiments, Response Surface Methodology, Factor Analysis, and the Normal Boundary Intersection method to guide the selection of Extreme Gradient Boosting hyperparameters under a fixed evaluation budget. The initial exploration is conducted through a fractional facecentered central composite design, totaling 88 configurations. The observed responses (accuracy, precision, recall, specificity, and runtime) are collected under a reproducible protocol and summarized through factor scores obtained via principal component analysis with Varimax rotation. These scores define quality and cost objective functions, reduce redundancy among metrics, and support an interpretable assessment of trade-offs. Quadratic responsesurface models are then fitted to the objective functions and used by Normal Boundary Intersection to sample an approximately uniform Pareto frontier; candidate solutions are reevaluated on the real model, and a final compromise configuration is selected. The proposed approach is benchmarked, under equivalent evaluation budgets, against grid search, random search, Bayesian optimization, and Hyperopt. Results show substantial computational savings: the method achieves an average runtime of 0.078 s per fold and an average total runtime of 158 s, reducing total time by 9% to 71% relative to the benchmarks while maintaining high and stable predictive performance across replications. As external validation, the proposed pipeline was replicated on two additional datasets with contrasting profiles (balanced and highly imbalanced), reproducing the cost–quality trade-off observed in the canonical benchmark and reinforcing the multivariate stability of the method. Overall, integrating Design of Experiments and Normal Boundary Intersection provides a parsimonious, interpretable, and replicable alternative for multiobjective hyperparameter tuning, with potential applicability to other Gradient Boosting Decision Tree families and cost-constrained settings. |
| Palavras-chave: | Otimização de hiperparâmetros Planejamento de experimentos Superfície de resposta Otimização multiobjetivo Interseção normal à fronteira Extreme Gradient Boosting |
| CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUÇÃO |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal de Itajubá |
| Sigla da Instituição: | UNIFEI |
| metadata.dc.publisher.department: | IEPG - Instituto de Engenharia de Produção e Gestão |
| metadata.dc.publisher.program: | Programa de Pós-Graduação: Mestrado - Engenharia de Produção |
| Citação: | RIBEIRO, Caio Tertuliano. Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira. 2026. 153 f. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal de Itajubá, Itajubá, 2026. |
| Tipo de Acesso: | Acesso Aberto |
| URI: | https://repositorio.unifei.edu.br/jspui/handle/123456789/4372 |
| Data do documento: | 19-Fev-2026 |
| Aparece nas coleções: | Dissertações |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Dissertação_2026032.pdf | 7,48 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
