Desmembrando Representações com Autoencoders Variacionais
Nos últimos anos, o aprendizado profundo (deep learning) emergiu como uma área de pesquisa transformadora dentro da inteligência artificial, trazendo tecnologias de ponta aplicáveis em diversos contextos, como visão computacional e processamento de linguagem natural. A capacidade desses modelos de capturar padrões subjacentes em dados complexos e transformá-los em representações úteis tem sido um dos principais fatores para seu sucesso. No entanto, uma limitação importante desses modelos é a forma como eles aprendem representações, frequentemente misturando fatores de variação que, para humanos, seriam considerados separadamente. A aprendizagem de representações desmembradas (disentangled representation learning) surge como uma abordagem promissora para resolver esse problema, permitindo que modelos identifiquem e separem fatores independentes de variação nos dados. Isso é particularmente relevante em aplicações que envolvem imagens faciais, como reconhecimento facial, análise de expressões e anti-spoofing. Recentemente, modelos baseados em autoencoders variacionais (VAEs) têm mostrado resultados promissores na extração de atributos faciais, como identidade e expressão, por meio de representações desmembradas. O objetivo deste trabalho é investigar a aplicação de modelos baseados em VAEs no contexto de aprendizagem de representações desmembradas, com foco na extração de atributos faciais. A pesquisa buscará compreender a controlabilidade e a topologia do espaço latente, com o intuito de melhorar o desempenho de tarefas relacionadas a imagens faciais, como reconhecimento de identidade e expressão facial, além de explorar a geração controlada de imagens.