Key points are not available for this paper at this time.
خلفية/أهداف: تهدف هذه الدراسة إلى تقييم أداء خوارزميات التصنيف المختلفة وطرق إعادة التعديل عبر مجموعات بيانات تشخيصية وتنبؤية متعددة للسرطان، مع معالجة تحديات عدم توازن الفئات. الأساليب: تم تحليل إجمالي خمسة مجموعات بيانات، بما في ذلك ثلاث مجموعات بيانات تشخيصية (قاعدة بيانات سرطان الثدي في ويسكونسن، مجموعة بيانات تنبؤ السرطان، مجموعة بيانات اكتشاف سرطان الرئة) ومجموعتين من بيانات التنبؤ (مجموعة بيانات سرطان الثدي في سير، مجموعة بيانات عودة سرطان الغدة الدرقية المتمايزة). تم استخدام تسعة عشر طريقة لإعادة التعديل من ثلاث فئات، وتم استخدام عشرة مصنفات من أربع فئات متميزة للمقارنة. النتائج: أظهرت النتائج أن الطرق الهجينة لأخذ العينات، لا سيما SMOTEENN، حققت أعلى أداء متوسط بنسبة 98.19%، تليها IHT (97.20%) وRENN (96.48%). من حيث المصنفات، أظهر Random Forest أفضل أداء بقيمة متوسطة قدرها 94.69%، مع اقتراب Balanced Random Forest وXGBoost. أدت الطريقة الأساسية (دون إعادة تعديل) إلى أداء أقل بكثير بلغ 91.33%، مما يبرز فعالية تقنيات إعادة التعديل في تحسين نتائج النموذج. الاستنتاجات: تؤكد هذه الأبحاث على أهمية طرق إعادة التعديل في تحسين أداء التصنيف على مجموعات بيانات غير متوازنة، مما يوفر رؤى قيمة للباحثين والمهنيين في الرعاية الصحية. تعتبر النتائج أساسًا لدراسات مستقبلية تهدف إلى دمج تقنيات تعلم الآلة في تشخيص وتنبؤ السرطان، مع توصيات لمزيد من البحث حول النماذج الهجينة والتطبيقات السريرية.
درس غوركان وآخرون (الثلاثاء) هذا السؤال.