Portal de Programas de Pós-Graduação (UFAL)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGI PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA INSTITUTO DE COMPUTAÇÃO Telefone/Ramal: 82 99632-4920 E-mail: rian@ic.ufal.br https://sigaa.sig.ufal.br/ppgi

Banca de QUALIFICAÇÃO: ARTHUR SENDAS FELIX ALMEIDA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : ARTHUR SENDAS FELIX ALMEIDA
DATA : 05/03/2024
HORA: 15:00
LOCAL: Online
TÍTULO: YoloSense8: detecçãoo e classificação de objetos em aplicaçõoes para deficientes visuais

PALAVRAS-CHAVES:

Processamento de Linguagem Natural,
Visão Computacional,
Aprendizado Profundo,
Redes Neurais Convolucionais,
Detecção e Classificação de Objetos,
Segmentação Semântica,
Análise de Espaço Vazio,
Análise de Superfície,
Pessoas Cegas,
Descrição de imagem,
Pessoas com Baixa Visão,
Tecnologia Assistiva,
Inclusão e Acessibilidade

PÁGINAS: 50
RESUMO:

Este estudo aborda a concepção e implementação de uma aplicação assistiva avançada, destinada a proporcionar autonomia a indivíduos com deficiência visual através da descrição em áudio de cenas capturadas por imagens. Integrando a visão computacional com o processamento de linguagem natural (PLN), o sistema utiliza uma versão modificada da YOLO-v8, conhecida como yoloSense8, e o modelo de linguagem de grandes dimensões LLaMA, de código aberto, para a detecção e interpretação precisas de objetos, pessoas, letras e números em imagens. A combinação do dataset ImageNet, rico em categorias de objetos, com o EMNIST, focado em caracteres alfanuméricos, juntamente com técnicas de transferência de aprendizado, permite ao modelo abranger uma ampla gama de elementos visuais e textuais. A tecnologia de texto para fala (TTS) é empregada para transformar as descrições textuais geradas em áudio, enquanto uma interface de usuário baseada em voz permite interações intuitivas por meio de comandos de voz, facilitando o uso da aplicação por pessoas cegas. Este trabalho contribui para o campo das tecnologias assistivas, destacando o potencial das técnicas de visão computacional e PLN na criação de ferramentas inclusivas. Avaliamos o desempenho do sistema em uma série de cenários reais, demonstrando sua eficácia em fornecer descrições detalhadas e contextualmente relevantes das cenas. Os resultados indicam que o sistema oferece uma solução promissora para melhorar a percepção ambiental de usuários com deficiência visual, evidenciando a importância da continuidade da pesquisa na interseção dessas tecnologias avançadas.

MEMBROS DA BANCA:
Presidente - 1645130 - LEANDRO DIAS DA SILVA
Interno(a) - ***.444.294-** - ALVARO ALVARES VDE CARVALHO CESAR SOBRINHO - Outros(as)
Interno(a) - 1766576 - THALES MIRANDA DE ALMEIDA VIEIRA
Externo(a) à Instituição - Lenardo Chaves e Silva - UFERSA

Notícia cadastrada em: 13/03/2024 12:36