CLASSIFICAÇÃO DA POTABILIDADE DA ÁGUA: UMA ABORDAGEM UTILIZANDO APRENDIZAGEM DE MÁQUINA EM SISTEMA EMBARCADO
Aprendizagem de máquina, Sistemas Embarcados, Classificação, Qualidade da água
O acesso à água potável é um recurso vital e um direito humano reconhecido. Contudo, ainda hoje, bilhões de pessoas sofrem com a falta de acesso à água adequada para consumo, o que pode levar a diversos problemas de saúde. Um dos principais desafios no monitoramento da qualidade da água é a coleta e análise de grandes volumes de dados. Modelos de Aprendizado de Máquina têm sido amplamente aplicados no monitoramento da qualidade da água para facilitar a tomada de decisão por gestores e prevenir a contaminação. Um sistema embarcado que integre sensores a um modelo de Aprendizado de Máquina poderia oferecer respostas em tempo real e seria viável para ser aplicado em qualquer local, independentemente da conexão com a internet. Esse sistema, no contexto da classificação da potabilidade da água, permitiria respostas mais rápidas diante de potenciais ameaças. Este estudo propõe um modelo de TinyML eficiente em termos energéticos para a classificação da potabilidade da água, utilizando apenas parâmetros que podem ser obtidos por meio de sensoriamento eletrônico. O estudo avaliou o desempenho utilizando métricas como Acurácia, Precisão, Recall, F1-Score, espaço ocupado em memória pelo modelo, tempo de execução e consumo de energia, e comparou modelos desenvolvidos com os algoritmos Random Forest e Redes Neurais. Também foi analisada a melhor combinação entre modelo e biblioteca de adaptação para o sistema embarcado.
O modelo de Aprendizado de Máquina inicial, utilizando Random Forest, demonstrou um desempenho notável, alcançando uma Precisão de 0.70 e, comparado à sua contraparte operando em um ambiente de nuvem, pode funcionar por anos com uma bateria comum como fonte de energia. Comparando todos os modelos e bibliotecas do estudo, o modelo de perceptron multicamadas com a biblioteca EmbML usou a menor memória, com 283.113 bytes, e o modelo Random Forest com Micromlgen teve o menor consumo de energia, usando apenas 104.534 milijoules. Este trabalho pode ajudar pesquisadores e profissionais a implementar sistemas de classificação de potabilidade da água e a usar TinyML em outros problemas de classificação também.