Elmano R. Cavalcanti (UFCG) | |
Carlos Eduardo Pires (UFCG) |
A mineração de texto tem sido utilizada para diversos propósitos, como na extração, classificação e categorização de documentos. Dentro desse contexto, este trabalho apresenta um estudo de caso em que foram utilizadas ferramentas de software livre com vistas à construção de um modelo classificador capaz de inferir o nível de cola existente entre provas escolares. A inferência do modelo foi comparada com a detecção tradicional (humana) de cola e quantificada estatisticamente pelas métricas: acurácia, precisão, recall, F-measure e índice Kappa. Os resultados apontam que o modelo criado apresentou uma boa qualidade na detecção do nível de cola entre provas, tornando possível sua utilização em situações de ensino reais.