Key points are not available for this paper at this time.
تتناول هذه الدراسة تحديات اختلال البيانات والقيم المفقودة في مجموعات بيانات معاملات بطاقات الائتمان من خلال استخدام الاستيفاء القائم على الوضع ونماذج التعلم الآلي المختلفة. قمنا بتحليل مجموعتين مختلفتين من البيانات: واحدة تتكون من حاملي بطاقات أوروبيين والأخرى من American Express، حيث تم تطبيق عدة خوارزميات تعلم آلي، بما في ذلك الشبكات العصبية الاصطناعية، والشبكات العصبية التلافيفية، وأشجار القرار المعززة بالتدرج، بالإضافة إلى غيرها. جدير بالذكر أن شجرة القرار المعززة بالتدرج أظهرت أداءً تنبؤياً متفوقاً، حيث زادت الدقة بنسبة 4.53%، مما جعلها تصل إلى 96.92% في مجموعة بيانات حاملي البطاقات الأوروبيين. لقد حسن الاستيفاء القائم على الوضع بشكل كبير من جودة البيانات، مما أتاح إجراء تحليل مستقر وموثوق لمجموعات البيانات المدمجة مع وجود حتى 50% من القيم المفقودة. وأكد اختبار الفرضيات أن أداء مجموعة البيانات المدمجة كان ذو دلالة إحصائية مقارنة بمجموعات البيانات الأصلية. تسلط هذه الدراسة الضوء على أهمية تقنيات معالجة البيانات القوية في تطوير أنظمة كشف الاحتيال الفعالة، مما يمهد الطريق للبحوث المستقبلية حول دمج مجموعات بيانات مختلفة وتحسين دقة التنبؤ في القطاع المالي.
فنج وآخرون (ثلاثاء) درسوا هذا السؤال.