تعد مجموعات بيانات عيوب البرمجيات، التي هي مجموعات من أخطاء البرمجيات، موارد أساسية لتسهيل الأبحاث التجريبية وتمكين المعايير القياسية لمجموعة واسعة من تقنيات هندسة البرمجيات، بما في ذلك المجالات الناشئة مثل تطوير البرمجيات المعتمدة على الذكاء الاصطناعي. على مر السنين، تم تطوير العديد من مجموعات بيانات عيوب البرمجيات، مما يوفر موارد غنية للمجتمع، ومع ذلك جعل من الصعب بشكل متزايد التنقل في هذه البيئة. يقدم هذا المقال استعراضًا شاملًا لـ 151 مجموعة بيانات لعيوب البرمجيات، يغطي نطاقها، وبنائها، وتوافرها، وقابليتها للاستخدام، واستخداماتها العملية. كما نقترح فرص بحثية مستقبلية بناءً على نتائجنا، مثل معالجة أنواع العيوب الممثلة بشكل ناقص. تتوفر كتالوج كامل لجميع مجموعات بيانات عيوب البرمجيات التي تم مسحها على https://defect-datasets.github.io/.
درس زو وآخرون (الأربعاء) هذا السؤال.