Predizendo a Participação de Desenvolvedores em Discussões em Projetos de Software Livre (WSL 2013)

Authors
André Luis Schwerz (UTFPR)
Rafael Liberato (UTFPR)
Igor Scaliante Wiese (UTFPR)
Igor Steinmacher (UTFPR)
Marco Aurélio Gerosa (USP)
João Eduardo Ferreira (USP)

Abstract
Desenvolvedores em projetos de software livre usam ferramentas de gestão e acompanhamento de tarefas para se comunicar. Essas ferramentas fornecem um grande volume de informações desestruturadas que dificulta a triagem de tarefas e atividades gerando uma sobrecarga de trabalho aos desenvolvedores Este trabalho mostra a importância do conteúdo dos comentários em um projeto de software livre para construção de um classificador para predizer a participação de um desenvolvedor em uma determinada tarefa. Para a elaboração desse classificador de predição, utilizamos dois algoritmos de aprendizagem de máquina Naïve Bayes e J48. Utilizamos dados de três subprojetos do Apache Hadoop para avaliar o uso desses algoritmos. Aplicando nossa abordagem aos desenvolvedores mais ativos destes subprojetos descobrimos que o algoritmo J48 apresenta resultados superiores ao algoritmo Naive Bayes. Com o algoritmo J48 obtivemos uma acurácia variando entre 79% a 96%. Os resultados indicam que o conteúdo dos comentários publicados em tarefas de projetos de software livre é um fator relevante para construir um classificador de predição de tarefas aos desenvolvedores.

Download paper (PDF)

Share

Metrics

Citations: by Google Scholar