Key points are not available for this paper at this time.
في هذه الورقة نقدم تحليلًا مقارنًا للقوة التنبؤية لمجموعتين مختلفتين من المقاييس للتنبؤ بالعيوب. نختار مجموعة تتعلق بالمنتجات ومجموعة تتعلق بالعمليات من مقاييس البرمجيات، ونستخدمها لتصنيف ملفات Java في مشروع Eclipse كملفات معيبة أو خالية من العيوب. يتم بناء نماذج التصنيف باستخدام ثلاثة متعلمي آلات مشتركين: الانحدار اللوجستي، وNaïve Bayes، وأشجار القرار. للسماح بتكاليف مختلفة لأخطاء التنبؤ، نقوم بإجراء تصنيف حساس للتكلفة، والذي يثبت أنه ناجح جدًا: >75% من الملفات المصنفة بشكل صحيح، واسترجاع >80%، ومعدل إيجابيات كاذبة <30%. تشير النتائج إلى أنه بالنسبة لبيانات Eclipse، فإن مقاييس العمليات هي أكثر كفاءة في التنبؤ بالعيوب من مقاييس الشيفرة.
درس موزر وزملاؤه (Sat) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: