Rastreamento de cães em vídeo usando destilação de conhecimento em codificadores de imagens
Rastreamento múltiplo de objetos; Segmentação de instâncias; Destilação de conhecimento; Monitoramento de comportamental animal; Modelos de fundação
O monitoramento contínuo de cães por vídeo pode auxiliar na detecção precoce de alterações comportamentais associadas a condições clínicas. Para isso, é fundamental dispor de sistemas capazes de segmentar e rastrear instâncias com precisão e baixa latência. Modelos de fundação como o Segment Anything Model 3 (SAM3) oferecem alto desempenho, mas apresentam custo computacional elevado, especialmente no codificador de imagens, o que dificulta sua aplicação em cenários de inferência contínua. Este trabalho propõe a destilação de conhecimento aplicada ao codificador visual do SAM3, transferindo suas representações para um modelo compacto e mais eficiente. No paradigma professor-aluno, o SAM3 completo atuará como referência, enquanto o codificador aluno será treinado para reproduzir representações intermediárias multi-escala, mantendo compatibilidade com o decodificador original. A avaliação será realizada em vídeos de cães capturados em ambiente controlado, considerando métricas de qualidade de segmentação, consistência temporal e custo computacional. O objetivo é reduzir significativamente a complexidade do modelo, preservando desempenho próximo ao original e viabilizando aplicações em tempo real.