Modelagem preditiva do alunado em escolas públicas do Brasil baseada em séries temporais
Predição do alunado; Programa Nacional do Livro Didático; Ciência de Dados; Séries temporais; Planejamento de Políticas Educacionais
Este trabalho investiga a aplicação de técnicas de análise de séries temporais para a predição do número de matrículas em escolas públicas do Brasil. A necessidade de estimativas mais consistentes decorre da importância dessas informações para o planejamento de políticas educacionais e para a logística de programas nacionais de grande escala, como o Programa Nacional do Livro e do Material Didático (PNLD). Nesse contexto, abordagens tradicionais de previsão, como média histórica, regressão linear e métodos de suavização exponencial, podem ser utilizadas por sua simplicidade e facilidade de aplicação. No entanto, tais métodos tendem a tratar as séries de forma agregada ou independente, capturando apenas tendências gerais e variações ao longo do tempo, o que pode limitar sua capacidade de representar dinâmicas específicas do ambiente escolar, como a progressão dos estudantes entre etapas de ensino dentro de uma mesma escola. Para investigar esse problema, foram utilizados dados do Censo Escolar referentes ao período de 2007 a 2025, abrangendo escolas públicas de todo o país. A partir desses dados, foram estruturadas séries temporais por escola e etapa de ensino, permitindo analisar a evolução do alunado ao longo do tempo. Com base nessa estrutura, o trabalho propõe um modelo preditivo que explora a continuidade dos estudantes em turmas de uma mesma escola ao longo dos anos, incorporando a progressão entre etapas de ensino como parte do processo de estimativa. Os resultados obtidos são comparados com abordagens tradicionais, como regressão linear e suavização exponencial, com o objetivo de avaliar o comportamento dos diferentes métodos na predição do quantitativo de estudantes.