Repositório UNIFEI UNIFEI - Campus 1: Itajubá PPG - Programas de Pós Graduação Dissertações
Use este identificador para citar ou linkar para este item: https://repositorio.unifei.edu.br/jspui/handle/123456789/4372
Registro completo de metadados
Campo DCValorIdioma
dc.creatorRIBEIRO, Caio Tertuliano-
dc.date.issued2026-02-19-
dc.identifier.citationRIBEIRO, Caio Tertuliano. Meta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteira. 2026. 153 f. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal de Itajubá, Itajubá, 2026.pt_BR
dc.identifier.urihttps://repositorio.unifei.edu.br/jspui/handle/123456789/4372-
dc.description.abstractHyperparameter tuning is decisive for both predictive performance and computational cost in machine learning models. In binary classification with Extreme Gradient Boosting, tuning is inherently multiobjective: predictive quality must be maximized while execution time is minimized. This work proposes a methodological framework that integrates Design of Experiments, Response Surface Methodology, Factor Analysis, and the Normal Boundary Intersection method to guide the selection of Extreme Gradient Boosting hyperparameters under a fixed evaluation budget. The initial exploration is conducted through a fractional facecentered central composite design, totaling 88 configurations. The observed responses (accuracy, precision, recall, specificity, and runtime) are collected under a reproducible protocol and summarized through factor scores obtained via principal component analysis with Varimax rotation. These scores define quality and cost objective functions, reduce redundancy among metrics, and support an interpretable assessment of trade-offs. Quadratic responsesurface models are then fitted to the objective functions and used by Normal Boundary Intersection to sample an approximately uniform Pareto frontier; candidate solutions are reevaluated on the real model, and a final compromise configuration is selected. The proposed approach is benchmarked, under equivalent evaluation budgets, against grid search, random search, Bayesian optimization, and Hyperopt. Results show substantial computational savings: the method achieves an average runtime of 0.078 s per fold and an average total runtime of 158 s, reducing total time by 9% to 71% relative to the benchmarks while maintaining high and stable predictive performance across replications. As external validation, the proposed pipeline was replicated on two additional datasets with contrasting profiles (balanced and highly imbalanced), reproducing the cost–quality trade-off observed in the canonical benchmark and reinforcing the multivariate stability of the method. Overall, integrating Design of Experiments and Normal Boundary Intersection provides a parsimonious, interpretable, and replicable alternative for multiobjective hyperparameter tuning, with potential applicability to other Gradient Boosting Decision Tree families and cost-constrained settings.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Itajubápt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectOtimização de hiperparâmetrospt_BR
dc.subjectPlanejamento de experimentospt_BR
dc.subjectSuperfície de respostapt_BR
dc.subjectOtimização multiobjetivopt_BR
dc.subjectInterseção normal à fronteirapt_BR
dc.subjectExtreme Gradient Boostingpt_BR
dc.titleMeta-otimização dos hiperparâmetros do algoritmo XGBoost para classificação binária: uma integração entre planejamento de experimentos e o método da interseção normal à fronteirapt_BR
dc.typeDissertaçãopt_BR
dc.date.available2026-03-15-
dc.date.available2026-04-15T13:51:48Z-
dc.date.accessioned2026-04-15T13:51:48Z-
dc.creator.Latteshttp://lattes.cnpq.br/3087349766668094pt_BR
dc.contributor.advisor1PAIVA, Anderson Paulo de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4728106898297335pt_BR
dc.description.resumoA calibração de hiperparâmetros é decisiva para o desempenho preditivo e o custo computacional de modelos de aprendizagem de máquina. Em classificação binária com Extreme Gradient Boosting, esse ajuste é inerentemente multiobjetivo: busca-se maximizar a qualidade preditiva e, simultaneamente, minimizar o tempo de execução. Este trabalho propõe um arcabouço metodológico que integra Planejamento de Experimentos, Metodologia de Superfície de Resposta, Análise Fatorial e o método Interseção Normal à Fronteira para orientar a seleção de hiperparâmetros do Extreme Gradient Boosting sob um orçamento fixo de avaliações. A exploração inicial do espaço é conduzida por um delineamento composto central de face centrada fracionário, totalizando 88 configurações. As respostas (acurácia, precisão, revocação, especificidade e tempo) são obtidas sob protocolo reprodutível com replicações e sintetizadas por escores fatoriais derivados de análise de componentes principais com rotação Varimax. Esses escores permitem definir funções objetivo de qualidade e de custo, reduzindo a redundância entre métricas e favorecendo a interpretação de trade-offs. Em seguida, modelos quadráticos de Metodologia de Superfície de Resposta são ajustados às funções objetivo e empregados pela Interseção Normal à Fronteira para amostrar uma fronteira de Pareto aproximadamente uniforme; as soluções candidatas são reavaliadas no modelo real e uma configuração final de compromisso é selecionada. A proposta é comparada, sob orçamento equivalente, com busca em grade, busca aleatória, otimização bayesiana e Hyperopt. Os resultados indicam redução substancial do custo computacional: o método proposto alcança tempo médio por fold de 0,078 s e tempo médio total de 158 s, com reduções de 9% a 71% no tempo total em relação aos benchmarks, mantendo desempenho preditivo elevado e estável entre réplicas. Como validação externa, o pipeline foi replicado em duas bases adicionais com perfis contrastantes (balanceada e desbalanceada), reproduzindo o padrão custo-qualidade observado no benchmark principal e reforçando a estabilidade multivariada do método. Conclui-se que a integração entre Planejamento de Experimentos e Interseção Normal à Fronteira constitui uma alternativa parcimoniosa, interpretável e replicável para calibração multiobjetivo de hiperparâmetros, com potencial de generalização para outros algoritmos da família Gradient Boosting Decision Trees e cenários com restrições de custo.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentIEPG - Instituto de Engenharia de Produção e Gestãopt_BR
dc.publisher.programPrograma de Pós-Graduação: Mestrado - Engenharia de Produçãopt_BR
dc.publisher.initialsUNIFEIpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUÇÃOpt_BR
Aparece nas coleções:Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_2026032.pdf7,48 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.