Dados Gerais do Componente Curricular
Tipo do Componente Curricular: |
DISCIPLINA |
Unidade Responsável: |
ENGENHARIA DE COMPUTAÇÃO (11.00.43.56.06) |
Curso: |
ENGENHARIA DE COMPUTAÇÃO - CAMPUS MACEIÓ - MATUTINO E VESPERTINO - PRESENCIAL - Maceió - BACHARELADO - Regular - Semestral (1139973) |
Código: |
ECOM179 |
Nome: |
PROCESSAMENTO DE LINGUAGEM NATURAL |
Carga Horária Teórica: |
60 h. |
Carga Horária Prática: |
0 h. |
Carga Horária de Ead: |
0 h. |
Carga Horária Total: |
60 h. |
Pré-Requisitos: |
|
Co-Requisitos: |
|
Equivalências: |
( ( COMP425 ) )
|
Excluir da Avaliação Institucional: |
Não |
Matriculável On-Line: |
Sim |
Horário Flexível da Turma: |
Não |
Horário Flexível do Docente: |
Sim |
Obrigatoriedade de Nota Final: |
Sim |
Pode Criar Turma Sem Solicitação: |
Sim |
Necessita de Orientador: |
Não |
Possui Subturmas: |
Não |
Exige Horário: |
Sim |
Quantidade de Avaliações: |
|
Ementa/Descrição: |
Técnicas de pré-processamento: tokenização, limpeza, remoção de stop words, stemização, etc. Modelos n-gram e aplicações. Medidas de similaridade de palavras e documentos: distância de Levenshtein, matriz termo-documento, bag of words, similaridade do cosseno, TF-IDF. Aprendizagem de Máquina para PLN: conceitos básicos, regressão logística, classificador Naïve-Bayes e SVM linear. Modelagem de tópicos, classificação e agrupamento de texto: espaços latentes, Alocação Latente de Dirichlet (LDA), análise semântica latente com SVD. Redes Neurais e vetores de palavras (word embeddings): word2vec e arquiteturas de redes neurais recorrentes (RNN). Reconhecimento de Entidades Nomeadas (NER). Etiquetagem gramatical de palavras. |
|
|
|