Key points are not available for this paper at this time.
تقييم المصنفات ليس مهمة سهلة. هناك طرق مختلفة لاختبارها وقياسات لتقدير أدائها. تم تعريف الغالبية العظمى من هذه القياسات لمشاكل التصنيف الثنائي ولا يوجد إجماع حول كيفية تعميمها على مشاكل التصنيف المتعدد. تقترح هذه الورقة توسيع F-measure و G-mean بنفس الطريقة التي تم تنفيذها باستخدام AUC. يتم استخدام بعض مجموعات البيانات ذات الخصائص المتنوعة لتوليد مصنفات غامضة وأشجار C4.5. يتم تنفيذ مقاييس التقييم الشائعة مقارنةً من حيث قيم مخرجاتها: كلما كانت الاستجابة أكبر، كانت القياسات أكثر تفاؤلاً. تشير النتائج إلى وجود مقاييس ذات سلوك جيد في أدوار متعارضة: واحدة دائمًا متفائلة والأخرى دائمًا متشائمة.
درس إسبيندولا وآخرون (الأربعاء) هذا السؤال.