Key points are not available for this paper at this time.
الملخص يقارن هذه الدراسة أداء ستة نماذج شائعة من الإحصاءات وتعلم الآلة في الكشف عن الاحتيال في البيانات المالية تحت افتراضات مختلفة لتكاليف التصنيف الخاطئ ونسب شركات الاحتيال إلى الشركات غير الاحتيالية. تظهر النتائج، بشكل مفاجئ بعض الشيء، أن الانحدار اللوجيستي وآلات الدعم الشعاعي تؤديان بشكل جيد مقارنة بالشبكة العصبية الاصطناعية، وbagging، وC4.5، وstacking. كما تكشف النتائج عن بعض التنوع في المؤشرات المستخدمة عبر خوارزميات التصنيف. من بين 42 مؤشراً تم فحصها، يتم اختيار ستة منها بشكل متسق واستخدامها من قبل خوارزميات التصنيف المختلفة: دوران المدقق، إجمالي التراكمات التقديرية، مدقق كبير 4، الحسابات المستحقة، الاجتماع أو تجاوز توقعات المحللين، والإنتاجية غير المتوقعة للموظفين. تمتد هذه النتائج إلى أبحاث الاحتيال في البيانات المالية ويمكن أن يستخدمها الممارسون والجهات التنظيمية لتحسين نماذج مخاطر الاحتيال. توفر البيانات: قائمة بالشركات الاحتيالية المستخدمة في هذه الدراسة متاحة من المؤلف عند الطلب. جميع مصادر البيانات الأخرى موصوفة في النص.
درس يوهان بيرولس (الشمس) هذا السؤال.