Repositório UNIFEI UNIFEI - Campus 1: Itajubá PPG - Programas de Pós Graduação Dissertações
Use este identificador para citar ou linkar para este item: https://repositorio.unifei.edu.br/jspui/handle/123456789/3927
Registro completo de metadados
Campo DCValorIdioma
dc.creatorLUZ, Thiago Sales Freire-
dc.date.issued2023-09-28-
dc.identifier.urihttps://repositorio.unifei.edu.br/jspui/handle/123456789/3927-
dc.description.abstractExoplanets are planets discovered outside our solar system. Their discovery happens because of scientific work with telescopes such as the Kepler. The data collected by Kepler is known as Kepler Object of Interest. Machine Learning algorithms are trained to classify these data into exoplanets or non-exoplanets. An Ensemble Algorithm is a type of Machine Learning technique that combines the prediction performance of two or more algorithms to gain an improved final prediction. The current works on exoplanet identification use mostly traditional non-Ensemble algorithms. Therefore, research that uses Ensemble algorithms for exoplanet identification is scarce. This paper performs a comparison among some Ensemble algorithms on the exoplanet identification process. Each algorithm is implemented with a set of different values for its parameters and executed multiple times. All executions are performed with the cross-validation method. A confusion matrix is created for each algorithm implementation. The results of each confusion matrix provided data to evaluate the following algorithm’s performance metrics: accuracy, sensitivity, specificity, precision, and F1 score. The Ensemble algorithms achieved an average performance of more than 80% in all metrics. Changing the default values of the Ensemble algorithms parameters improved their predictive performance. The algorithm with the best performance is Stacking. In summary, the Ensemble algorithms have great potential to improve exoplanet prediction. The Stacking algorithm achieved a higher performance than the other algorithms. This aspect is discussed in the text. The results of this work show that it is reasonable to increase the use of Ensemble algorithms. The reason is their high prediction performance to improve exoplanet identification.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Itajubápt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAlgoritmos ensemblept_BR
dc.subjectKOIpt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectMatriz de confusãopt_BR
dc.subjectStackingpt_BR
dc.titleAnálise e comparação de algoritmos ensemble de classificação na descoberta de exoplanetaspt_BR
dc.typeDissertaçãopt_BR
dc.date.available2023-10-31-
dc.date.available2023-10-31T11:49:19Z-
dc.date.accessioned2023-10-31T11:49:19Z-
dc.creator.Latteshttp://lattes.cnpq.br/1717282381510877pt_BR
dc.contributor.advisor1RIBEIRO, Enio Roberto-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6416752942017019pt_BR
dc.contributor.advisor-co1BRAGA, Rodrigo Aparecido da Silva-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4343678779982973pt_BR
dc.description.resumoExoplanetas são planetas encontrados fora do sistema solar. A descoberta dos exoplanetas ocorre devido ao trabalho científico envolvendo o uso de telescópios, entre eles, o Kepler. Os dados coletados por este telescópio são chamados de Kepler Object of Interest. Para a tarefa de identificação de padrões nestes dados são utilizados algoritmos de Aprendizado de Máquina. Estes algoritmos são treinados para classificar estes dados em exoplanetas ou em falso-exoplaneta, isto é, falso-positivo. Dentre os algoritmos de classificação têm-se os denominados algoritmos Ensemble. Estes algoritmos combinam o desempenho de predição de dois ou mais algoritmos visando aperfeiçoar o desempenho preditivo final. Na literatura são utilizados algoritmos tradicionais em pesquisas relacionadas a detecção de exoplanetas. Constata-se, dessa forma, a carência de trabalhos que utilizam algoritmos Ensemble com este propósito. Esta dissertação realiza uma comparação de desempenho entre algoritmos Ensemble no processo de identificação de exoplanetas. Cada algoritmo é implementado com um conjunto de diferentes valores de parâmetros e executado várias vezes por um processo de validação cruzada. Uma matriz de confusão é gerada em cada execução, a qual é usada para análise das seguintes métricas de desempenho do algoritmo: exatidão, sensibilidade, especificidade, precisão e nota F1. Os algoritmos Ensemble atingiram um desempenho maior que 80% de acerto na maioria das métricas. Com a alteração dos valores dos parâmetros das funções observa-se um melhor resultado na predição. O algoritmo com o melhor desempenho foi o Stacking. Em síntese, verifica que os algoritmos Ensemble possuem um grande potencial para melhorar o resultado da predição de exoplanetas. O algoritmo Stacking se mostrou superior aos demais algoritmos e este aspecto é discutido no artigo. Os resultados desta dissertação indicam ser relevante aumentar o uso destes algoritmos, por possuírem um alto desempenho preditivo, favorecendo a detecção de exoplanetas.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentIESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computaçãopt_BR
dc.publisher.initialsUNIFEIpt_BR
dc.subject.cnpqCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.relation.referencesLUZ, Thiago Sales Freire. Análise e comparação de algoritmos ensemble de classificação na descoberta de exoplanetas. 2023. 84 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itabira, 2023.pt_BR
Aparece nas coleções:Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_2023134.pdf2,76 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.