LakeEdu: Uma Arquitetura Interoperável e Integrada de Data Lake para Promover a Governança de Dados no Ecossistema Educacional
Governança de Dados, Arquitetura de Dados, Interoperabilidade, Integração de Dados, Data Lake.
O avanço exponencial na geração de dados está intimamente ligado ao crescimento das capacidades computacionais e à inovação nos métodos de coleta e análise de informações. Fatores como o aumento da conectividade e o uso massivo de dispositivos conectados, como smartphones e aplicativos de redes sociais, têm contribuído significativamente para a relevância dos dados na sociedade moderna. Esse cenário se estende ao campo da educação, onde os dados emergem como uma ferramenta crucial para identificar padrões de aprendizagem, otimizar currículos e aprimorar métodos de ensino. No entanto, a qualidade dos dados, que envolve precisão, completude, oportunidade, consistência com os requisitos e regras de negócios, além de relevância, representa um dos principais desafios neste contexto. A falta de uma arquitetura de dados integrada e interoperável compromete significativamente a eficácia da utilização dos dados no contexto educacional. Diante disso, este estudo investiga como as abordagens de governança de dados, focadas em integração e interoperabilidade, estão sendo aplicadas nesse campo. Para tanto, foi realizado um levantamento no estado da arte sobre as metodologias, tecnologias e tendências da governança de dados, considerando tanto as especificidades do contexto educacional quanto às práticas em outros contextos que possam servir de base para adaptações e boas práticas. Como parte do estudo, também será conduzida uma investigação no estado da prática para analisar modelos arquiteturais aplicáveis ao desenvolvimento de um data lake integrado e interoperável no contexto educacional. A pesquisa visa identificar as melhores práticas e frameworks existentes que possam ser adaptados para essa finalidade. A principal contribuição desta dissertação será o projeto e a implementação de uma arquitetura conceitual para um data lake, integrando modelos arquiteturais e um mecanismo de especificação de mensagens que padronize a comunicação e a troca de dados entre diferentes sistemas e plataformas, com foco em eficiência, escalabilidade e qualidade dos dados. Por fim, serão realizados estudos de caso em instituições educacionais para aplicar e testar a arquitetura proposta, documentando o processo de implementação e os desafios encontrados, a fim de validar a solução em um ambiente real.