Skelibras: Uma extensa base de dados de Libras construída com esqueletos 2D
Aprendizado de máquina, Aprendizado Profundo, Reconhecimento de Línguas de Sinais, Libras, Visão Computacional
O reconhecimento de sinais dinâmicos de línguas de sinais é uma tarefa difícil que começa a se tornar praticável com o uso de redes neurais profundas. Porém, a ausência de grandes bases de dados anotadas inviabiliza o treinamento destes classificadores. Neste trabalho, foi construída uma base de dados, entitulada Skelibras, contendo 57760 amostras divididas em 6572 classes de sinais dinâmicos da Língua Brasileira de Sinais (Libras). Cada sinal contém sequências de esqueletos (poses) do corpo e das mãos, extraída e sincronizada automaticamente de vídeos da base Corpus de Libras. Para extrair e organizar esses dados anotados de forma consistente, apresenta-se uma metodologia capaz de identificar e rastrear as poses de cada falante; sincronizar legendas e falantes presentes nas conversas; e sincronizar dados de vídeos adquiridos a partir de distintos pontos de vista com as legendas. Realizamos experimentos em variações de redes neurais profundas baseadas em camadas convolucionais, camadas densas, e unidades LSTMs para validar e fornecer resultados preliminares na base gerada neste trabalho, possibilitando assim a comparação futura com novos métodos de reconhecimento de sinais dinâmicos.