Repositório UNIFEI UNIFEI - Campus 1: Itajubá PPG - Programas de Pós Graduação Dissertações
Use este identificador para citar ou linkar para este item: https://repositorio.unifei.edu.br/jspui/handle/123456789/3576
Tipo: Dissertação
Título: Ideb, as unidades da federação e o perfil das escolas públicas: uma análise exploratória de dados não supervisionada
Autor(es): ALVES, Igor Moreira
Primeiro Orientador: SILVEIRA, Carlos Henrique da
metadata.dc.contributor.advisor-co1: KUEEHNE, Bruno Tardiole
Resumo: Essa dissertação busca o uso da ciência dos dados, por meio de análise exploratória não supervisionada, comprovar o que a literatura já sabe e/ou apresentar novas descobertas sobre a influência da infraestrutura sobre a educação básica brasileira. A infraestrutura escolar não se resume apenas à questão arquitetônica das escolas, mas também ao ambiente educativo e administrativo, equipamentos, recursos educacionais, práticas, currículos e processo de ensino e aprendizagem. A coleta de dados foi realizada sobre os dados abertos do Censo Escolar 2019 (Educação Básica) e do Índice de Desenvolvimento da Educação Básica (Ideb), relativos aos anos 2005-2019. A escolha do ano de 2019 foi por se tratar do último ano que as escolas apresentaram resultados antes da influência da pandemia COVID-19. Após vários tratamentos nos dados e a escolha de atendimento apenas do segmento inicial do ensino fundamental, aplicou-se duas metodologias de análise: Correlograma e Análise Fatorial (FA). Para uma clareza nos resultados, criou-se novos atributos referentes aos entes federativos que permitiu identificar quais estados e perfis de escolas estão melhores relacionados ao crescimento e aos bons resultados do Ideb. Para essas correlações optou-se pela Sigma da Cópula Gaussiana que leva em consideração os dados categóricos e contínuos e, ainda, gerou uma matriz positiva definida. O Correlograma gerou uma matriz quadrada que apresentou os relacionamentos dos atributos em um dendrograma de heatmap. Dividido em 4 grandes grupos, cada um apresentou características específicas e relações com os entes federativos. O primeiro grupo apresentou forte relacionamento com as infraestruturas básicas; o segundo grupo, com o Ideb e as infraestruturas mais sofisticadas; o terceiro grupo, apresentou poucas relações entre os atributos; e último grupo forte correlações negativas e conteve maior precariedade nas infraestruturas. Após averiguação de compatibilidade da base de dados para aplicação do FA, foram estimados que 10 fatores seriam adequados a esse estudo. Quatro fatores apresentaram associação com os atributos do Ideb, o foco deste trabalho. Observou-se também três padrões nos atributos que elencaram bons resultados no Ideb com diferentes infraestruturas, políticas e/ou propostas educacionais: o primeiro grupo, norteado por SP, apresentou saneamentos básicos ofertados pelo serviço público, internet de qualidade com uso na aprendizagem e órgãos escolares; o segundo grupo, encabeçado por MG, indica associação a flexibilização no ensino tradicional, com ciclos escolares e salas não seriadas; o terceiro grupo ficou marcado pelas atividades complementares e atendimento especializado, representado pelo CE. Em contradição a esses parâmetros, escolas com a modalidade EJA, principalmente do nordeste, tendem a ter menores resultados no Ideb. Os outros 6 fatores agregaram muitas informações relevantes, inclusive relacionadas às correlações e anti correlações dos entes federativos e atributos específicos. Como visto, a ciência dos dados tem muito a agregar à área da educação. Espera-se com trabalhos futuros acrescentar ainda mais dados, como estudos longitudinais sobre o Ideb e agregar outros índices educacionais como o Ioeb e o nível socioeconômico da população.
Abstract: This dissertation seeks to use data science, through unsupervised exploratory analysis, to prove what the literature already knows and/or present new discoveries about the influence of infrastructure on Brazilian basic education. School infrastructure is not limited to the architectural issue of schools, but also to the educational and administrative environment, equipment, educational resources, practices, curricula and the teaching and learning process. Data collection was carried out on open data from the 2019 School Census (Basic Education) and the Basic Education Development Index (Ideb), for the years 2005-2019. The choice of the year 2019 was because it was the last year that schools presented results before the influence of the COVID-19 pandemic. After several data treatments and the choice of attending only the initial segment of fundamental education, two analysis methodologies were applied: Correlogram and Factor Analysis (FA). For clarity in the results, new attributes were created referring to the federative entities that allowed identifying which states and school profiles are better related to the growth and good results of the Ideb. For these correlations, the Sigma of the Gaussian Copula was chosen, which takes into account the categorical and continuous data and also generated a definite positive matrix. The Correlogram generated a square matrix that presented the attribute relationships in a Heatmap Dendrogram. Divided into 4 large groups, each one had specific characteristics and relationships with federal entities. The first group had a strong relationship with basic infrastructure; the second group, with IDEB and the most sophisticated infrastructures; the third group showed few relationships between the attributes; and the last group had strong negative correlations and contained greater precariousness in infrastructure. After verifying the compatibility of the database for the application of the FA, it was estimated that 10 factors would be suitable for this study. Four factors were associated with the attributes of the Ideb, the focus of this work. Three patterns were also observed in the attributes that listed good results in the Ideb with different infrastructures, policies and/or educational proposals: the first group, guided by São Paulo state, presented basic sanitation offered by the public service, quality internet for use in learning and institutions schoolchildren; the second group, headed by Minas Gerais state, indicates an association with flexibility in traditional teaching, with school cycles and non-serial classrooms; the third group was marked by complementary activities and specialized care, represented by the Ceará state. In contradiction to these parameters, schools with the EJA modality, mainly in the northeast, tend to have lower results in the Ideb. The other 6 factors added a lot of relevant information, including those related to the correlations and anti-correlations of the federative entities and specific attributes. As seen, data science has a lot to add to the field of education. Future works are expected to add even more data, such as longitudinal studies on the Ideb and to add other educational indices such as the Ioeb and the socioeconomic level of the population.
Palavras-chave: Educação - Escolas públicas
Ideb
Ciência dos dados
Análise exploratória não supervisionada
CNPq: CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Idioma: por
País: Brasil
Editor: Universidade Federal de Itajubá
Sigla da Instituição: UNIFEI
metadata.dc.publisher.department: IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
metadata.dc.publisher.program: Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.unifei.edu.br/jspui/handle/123456789/3576
Data do documento: 24-Fev-2023
Aparece nas coleções:Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_2023043.pdf2,37 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.