Los puntos clave no están disponibles para este artículo en este momento.
Las empresas de software gastan más del 45 por ciento de su costo en el manejo de errores de software. Un paso inevitable para solucionar errores es el triaje de errores, que tiene como objetivo asignar correctamente a un desarrollador a un nuevo error. Para disminuir el costo de tiempo en el trabajo manual, se aplican técnicas de clasificación de texto para realizar un triaje automático de errores. En este documento, abordamos el problema de la reducción de datos para el triaje de errores, es decir, cómo reducir la escala y mejorar la calidad de los datos de errores. Combinamos la selección de instancias con la selección de características para reducir simultáneamente la escala de datos en la dimensión de errores y en la dimensión de palabras. Para determinar el orden de aplicación de la selección de instancias y la selección de características, extraemos atributos de conjuntos de datos históricos de errores y construimos un modelo predictivo para un nuevo conjunto de datos de errores. Investigamos empíricamente el rendimiento de la reducción de datos en un total de 600,000 informes de errores de dos grandes proyectos de código abierto, a saber, Eclipse y Mozilla. Los resultados muestran que nuestra reducción de datos puede reducir efectivamente la escala de datos y mejorar la precisión del triaje de errores. Nuestro trabajo proporciona un enfoque para aprovechar técnicas en el procesamiento de datos para formar datos de errores reducidos y de alta calidad en el desarrollo y mantenimiento de software.
Xuan et al. (Fri,) estudiaron esta pregunta.