Aprimorando Sistemas de ALPR Utilizando Modelos Visuais de Linguagem Baseados em Aprendizado Contrastivo
prendizado Contrastivo, Reconhecimento de Caracteres, Edge AI, ALPR, VLMs, CLIP
Esta dissertação investiga o uso do Aprendizado Contrastivo para aprimorar as representações de caracteres em Sistemas Automatizados de Reconhecimento de Placas Veiculares (ALPR — Automatic License Plate Recognition). A motivação decorre das limitações de abordagens tradicionais na distinção de elementos visualmente semelhantes, como o caractere “O” e o numeral 0 (zero), ou a semelhança entre o numeral “1” e a letra “I”.
Nesse contexto, propõe-se o emprego de Vision-Language Models (VLMs) fundamentados em Aprendizado Contrastivo, explorando o alinhamento entre informações visuais e textuais para enriquecer as representações dos dados.
O objetivo principal é avaliar o potencial desses modelos na redução de ambiguidades visuais e erros de classificação em sistemas ALPR, considerando:
RQ1: o impacto do aprendizado contrastivo no desempenho do reconhecimento de caracteres;
RQ2: a viabilidade de implementação desses modelos em dispositivos edge sem perda significativa de acurácia.
A metodologia inclui revisão da literatura e experimentos computacionais conduzidos com bibliotecas consolidadas e conjuntos de dados específicos do domínio, assegurando a validade e a reprodutibilidade dos resultados.
A relevância do estudo reside no aprimoramento de sistemas amplamente utilizados em cenários de transportes inteligentes, por meio da adoção de técnicas contemporâneas de aprendizado profundo. A abordagem metodológica é justificada pelo avanço recente do Aprendizado Contrastivo e sua aplicação no desenvolvimento de modelos multimodais visuais e linguísticos.
Os resultados experimentais indicam que VLMs conseguem interpretar o contexto da cena e realizar o reconhecimento adequado do texto presente na imagem. Contudo, observou-se que a dispersão das informações visuais pode afetar negativamente a capacidade de focalização precisa na placa do veículo.
A análise crítica revela o potencial de aplicação de VLMs no contexto de ALPR, contribuindo para ampliar o conjunto de técnicas disponíveis para a implementação de sistemas de transporte inteligentes.
Este trabalho contribui para a área ao: (1) apresentar uma metodologia para utilização de VLMs em ALPR; (2) demonstrar empiricamente seus impactos no reconhecimento de caracteres; (3) propor direções para pesquisas futuras, como: ajuste fino (fine-tuning) de VLMs consolidados; experimentação com datasets específicos do domínio de ALPR.