IDENTIFICAÇÃO AUTOMÁTICA DA PRESENÇA SOCIAL EM DISCUSSÕES ONLINE ESCRITAS EM PORTUGUÊS
Esta dissertação de mestrado apresenta um método que permite a análise automatizada de mensagens provenientes de fóruns online de ensino a distância escritas em português brasileiro. Particularmente, analisa o problema da codificação de mensagens de discussão para níveis de presença social, um importante construto do modelo de Comunidade de Investigação amplamente utilizado na aprendizagem online. Apesar de existirem técnicas de codificação para a presença social na língua inglesa, a literatura ainda é carente em métodos para as demais línguas, como o português. O método aqui proposto utiliza-se de um conjunto de 158 características extraídas de dois recursos, LIWC e Coh-Metrix, disponíveis para análise textual através de técnicas de Mineração de Texto, para criar um classificador para cada uma das três categorias da presença social. Para isso foram utilizados três tipos de algoritmos, Random Forest, AdaBoost e XGBoost onde o melhor modelo desenvolvido atingiu 85,68% de acurácia e índice Kappa (k) de 0,70, o que representa uma concordância substancial, e está bem acima do grau de puro acaso. Este trabalho também provê uma análise da natureza da presença social, observando as características de classificação que foram mais relevantes para distinguir as três categorias da presença social e uma análise comparativa sobre as principais características identificadas nas fases da presença em diferentes domínios.
Presença Social, Modelo de Comunidade de Investigação (CoI), Discussões Online, Classificação de Texto.