dc.creator |
ALVES, Igor Moreira |
|
dc.date.issued |
2023-02-24 |
|
dc.identifier.uri |
https://repositorio.unifei.edu.br/jspui/handle/123456789/3576 |
|
dc.description.abstract |
This dissertation seeks to use data science, through unsupervised exploratory analysis,
to prove what the literature already knows and/or present new discoveries about the
influence of infrastructure on Brazilian basic education. School infrastructure is not
limited to the architectural issue of schools, but also to the educational and
administrative environment, equipment, educational resources, practices, curricula and
the teaching and learning process. Data collection was carried out on open data from the
2019 School Census (Basic Education) and the Basic Education Development Index
(Ideb), for the years 2005-2019. The choice of the year 2019 was because it was the last
year that schools presented results before the influence of the COVID-19 pandemic.
After several data treatments and the choice of attending only the initial segment of
fundamental education, two analysis methodologies were applied: Correlogram and
Factor Analysis (FA). For clarity in the results, new attributes were created referring to
the federative entities that allowed identifying which states and school profiles are
better related to the growth and good results of the Ideb. For these correlations, the
Sigma of the Gaussian Copula was chosen, which takes into account the categorical and
continuous data and also generated a definite positive matrix. The Correlogram
generated a square matrix that presented the attribute relationships in a Heatmap
Dendrogram. Divided into 4 large groups, each one had specific characteristics and
relationships with federal entities. The first group had a strong relationship with basic
infrastructure; the second group, with IDEB and the most sophisticated infrastructures;
the third group showed few relationships between the attributes; and the last group had
strong negative correlations and contained greater precariousness in infrastructure. After
verifying the compatibility of the database for the application of the FA, it was
estimated that 10 factors would be suitable for this study. Four factors were associated
with the attributes of the Ideb, the focus of this work. Three patterns were also observed
in the attributes that listed good results in the Ideb with different infrastructures, policies
and/or educational proposals: the first group, guided by São Paulo state, presented basic
sanitation offered by the public service, quality internet for use in learning and
institutions schoolchildren; the second group, headed by Minas Gerais state, indicates
an association with flexibility in traditional teaching, with school cycles and non-serial
classrooms; the third group was marked by complementary activities and specialized
care, represented by the Ceará state. In contradiction to these parameters, schools with
the EJA modality, mainly in the northeast, tend to have lower results in the Ideb. The
other 6 factors added a lot of relevant information, including those related to the
correlations and anti-correlations of the federative entities and specific attributes. As
seen, data science has a lot to add to the field of education. Future works are expected to
add even more data, such as longitudinal studies on the Ideb and to add other
educational indices such as the Ioeb and the socioeconomic level of the population. |
pt_BR |
dc.language |
por |
pt_BR |
dc.publisher |
Universidade Federal de Itajubá |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.subject |
Educação - Escolas públicas |
pt_BR |
dc.subject |
Ideb |
pt_BR |
dc.subject |
Ciência dos dados |
pt_BR |
dc.subject |
Análise exploratória não supervisionada |
pt_BR |
dc.title |
Ideb, as unidades da federação e o perfil das escolas públicas: uma análise exploratória de dados não supervisionada |
pt_BR |
dc.type |
Dissertação |
pt_BR |
dc.date.available |
2023-03-31 |
|
dc.date.available |
2023-03-31T16:13:27Z |
|
dc.date.accessioned |
2023-03-31T16:13:27Z |
|
dc.creator.Lattes |
http://lattes.cnpq.br/8859505233450089 |
pt_BR |
dc.contributor.advisor1 |
SILVEIRA, Carlos Henrique da |
|
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/3775476837964989 |
pt_BR |
dc.contributor.advisor-co1 |
KUEEHNE, Bruno Tardiole |
|
dc.contributor.advisor-co1Lattes |
http://lattes.cnpq.br/6380098950336268 |
pt_BR |
dc.description.resumo |
Essa dissertação busca o uso da ciência dos dados, por meio de análise
exploratória não supervisionada, comprovar o que a literatura já sabe e/ou apresentar
novas descobertas sobre a influência da infraestrutura sobre a educação básica
brasileira. A infraestrutura escolar não se resume apenas à questão arquitetônica das
escolas, mas também ao ambiente educativo e administrativo, equipamentos, recursos
educacionais, práticas, currículos e processo de ensino e aprendizagem. A coleta de
dados foi realizada sobre os dados abertos do Censo Escolar 2019 (Educação Básica) e
do Índice de Desenvolvimento da Educação Básica (Ideb), relativos aos anos
2005-2019. A escolha do ano de 2019 foi por se tratar do último ano que as escolas
apresentaram resultados antes da influência da pandemia COVID-19. Após vários
tratamentos nos dados e a escolha de atendimento apenas do segmento inicial do ensino
fundamental, aplicou-se duas metodologias de análise: Correlograma e Análise Fatorial
(FA). Para uma clareza nos resultados, criou-se novos atributos referentes aos entes
federativos que permitiu identificar quais estados e perfis de escolas estão melhores
relacionados ao crescimento e aos bons resultados do Ideb. Para essas correlações
optou-se pela Sigma da Cópula Gaussiana que leva em consideração os dados
categóricos e contínuos e, ainda, gerou uma matriz positiva definida. O Correlograma
gerou uma matriz quadrada que apresentou os relacionamentos dos atributos em um
dendrograma de heatmap. Dividido em 4 grandes grupos, cada um apresentou
características específicas e relações com os entes federativos. O primeiro grupo
apresentou forte relacionamento com as infraestruturas básicas; o segundo grupo, com o
Ideb e as infraestruturas mais sofisticadas; o terceiro grupo, apresentou poucas relações
entre os atributos; e último grupo forte correlações negativas e conteve maior
precariedade nas infraestruturas. Após averiguação de compatibilidade da base de dados
para aplicação do FA, foram estimados que 10 fatores seriam adequados a esse estudo.
Quatro fatores apresentaram associação com os atributos do Ideb, o foco deste trabalho.
Observou-se também três padrões nos atributos que elencaram bons resultados no Ideb
com diferentes infraestruturas, políticas e/ou propostas educacionais: o primeiro grupo,
norteado por SP, apresentou saneamentos básicos ofertados pelo serviço público,
internet de qualidade com uso na aprendizagem e órgãos escolares; o segundo grupo,
encabeçado por MG, indica associação a flexibilização no ensino tradicional, com ciclos
escolares e salas não seriadas; o terceiro grupo ficou marcado pelas atividades
complementares e atendimento especializado, representado pelo CE. Em contradição a
esses parâmetros, escolas com a modalidade EJA, principalmente do nordeste, tendem a
ter menores resultados no Ideb. Os outros 6 fatores agregaram muitas informações
relevantes, inclusive relacionadas às correlações e anti correlações dos entes federativos
e atributos específicos. Como visto, a ciência dos dados tem muito a agregar à área da
educação. Espera-se com trabalhos futuros acrescentar ainda mais dados, como estudos
longitudinais sobre o Ideb e agregar outros índices educacionais como o Ioeb e o nível
socioeconômico da população. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação |
pt_BR |
dc.publisher.program |
Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação |
pt_BR |
dc.publisher.initials |
UNIFEI |
pt_BR |
dc.subject.cnpq |
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.relation.references |
ALVES, Igor Moreira. Ideb, as unidades da federação e o perfil das escolas públicas: uma análise exploratória de dados não supervisionada. 2023. 124 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itabira, 2023. |
pt_BR |