EXTRAÇÃO DE INFORMAÇÕES DE PRONTUÁRIOS ELETRÔNICOS DE PACIENTES HEPATOPATAS USANDO PROCESSAMENTO DE LINGUAGEM NATURAL
Processamento de Linguagem Natural, Registros Médicos, Prontuários Eletrônicos de Saúde.
Muitas das informações cruciais para o manejo de pacientes hepatopatas permanecem registradas em textos livres nas evoluções médicas do Prontuário Eletrônico do Paciente, o que limita o uso secundário desses dados e dificulta o uso diário pelos hepatologistas. Esta proposta de trabalho propõe avaliar a eficácia de Modelos de Linguagem de Larga Escala (LLMs) para extrair automaticamente informações essenciais — diagnósticos, exames laboratoriais, escores prognósticos (MELD, APRI, FIB-4, Child-Pugh) — e sintetizá-las em relatórios estruturados de apoio à decisão. O estudo utilizará um conjunto real de 11.000 registros (34\% de anamneses e 66\% de evoluções) de mais de 3.000 pacientes atendidos no Hospital Universitário Professor Alberto Antunes, de junho de 2021 a maio de 2025. Serão utilizadas ferramentas de pré-processamento e anonimização dos registros, dentre elas a linguagem Python com spaCy, NLTK e Pandas, assim como LLMs de última geração na extração de informação, orquestrados por LangChain e acessados localmente e em nuvem. Serão exploradas estratégias \textit{zero-shot}, \textit{few-shot} e \textit{chain-of-thought} em conjunto com armazenamento persistente das saídas em Supabase. Ao eliminar a necessidade de anotação manual, a proposta avaliará o potencial de LLMs como ferramenta prática para acelerar a análise de prontuários hepatológicos e reduzir custos operacionais.