Dados Gerais do Componente Curricular
| Tipo do Componente Curricular: |
DISCIPLINA |
| Unidade Responsável: |
ENGENHARIA DE COMPUTAÇÃO (11.00.43.56.06) |
| Curso: |
ENGENHARIA DE COMPUTAÇÃO - CAMPUS MACEIÓ - MATUTINO E VESPERTINO - PRESENCIAL - Maceió - BACHARELADO - Regular - Semestral (1139973) |
| Código: |
ECOM179 |
| Nome: |
PROCESSAMENTO DE LINGUAGEM NATURAL |
| Carga Horária Teórica: |
60 h. |
| Carga Horária Prática: |
0 h. |
| Carga Horária de Ead: |
0 h. |
| Carga Horária Total: |
60 h. |
| Pré-Requisitos: |
|
| Co-Requisitos: |
|
| Equivalências: |
( ( COMP425 ) )
|
| Excluir da Avaliação Institucional: |
Não |
| Matriculável On-Line: |
Sim |
| Horário Flexível da Turma: |
Não |
| Horário Flexível do Docente: |
Sim |
| Obrigatoriedade de Nota Final: |
Sim |
| Pode Criar Turma Sem Solicitação: |
Sim |
| Necessita de Orientador: |
Não |
| Possui Subturmas: |
Não |
| Exige Horário: |
Sim |
| Quantidade de Avaliações: |
|
| Ementa/Descrição: |
Técnicas de pré-processamento: tokenização, limpeza, remoção de stop words, stemização, etc. Modelos n-gram e aplicações. Medidas de similaridade de palavras e documentos: distância de Levenshtein, matriz termo-documento, bag of words, similaridade do cosseno, TF-IDF. Aprendizagem de Máquina para PLN: conceitos básicos, regressão logística, classificador Naïve-Bayes e SVM linear. Modelagem de tópicos, classificação e agrupamento de texto: espaços latentes, Alocação Latente de Dirichlet (LDA), análise semântica latente com SVD. Redes Neurais e vetores de palavras (word embeddings): word2vec e arquiteturas de redes neurais recorrentes (RNN). Reconhecimento de Entidades Nomeadas (NER). Etiquetagem gramatical de palavras. |
|
|
|
|
|
|
|
|