André Luis Schwerz (UTFPR) | |
Rafael Liberato (UTFPR) | |
Igor Scaliante Wiese (UTFPR) | |
Igor Steinmacher (UTFPR) | |
Marco Aurélio Gerosa (USP) | |
João Eduardo Ferreira (USP) |
Desenvolvedores em projetos de software livre usam ferramentas de gestão e acompanhamento de tarefas para se comunicar. Essas ferramentas fornecem um grande volume de informações desestruturadas que dificulta a triagem de tarefas e atividades gerando uma sobrecarga de trabalho aos desenvolvedores Este trabalho mostra a importância do conteúdo dos comentários em um projeto de software livre para construção de um classificador para predizer a participação de um desenvolvedor em uma determinada tarefa. Para a elaboração desse classificador de predição, utilizamos dois algoritmos de aprendizagem de máquina Naïve Bayes e J48. Utilizamos dados de três subprojetos do Apache Hadoop para avaliar o uso desses algoritmos. Aplicando nossa abordagem aos desenvolvedores mais ativos destes subprojetos descobrimos que o algoritmo J48 apresenta resultados superiores ao algoritmo Naive Bayes. Com o algoritmo J48 obtivemos uma acurácia variando entre 79% a 96%. Os resultados indicam que o conteúdo dos comentários publicados em tarefas de projetos de software livre é um fator relevante para construir um classificador de predição de tarefas aos desenvolvedores.