تتطلب الزيادة السريعة في مصادر الأخبار الرقمية اليوم التحليل والتصنيف الفعال للبيانات النصية على نطاق واسع. في هذه الدراسة، تم تقييم BERT (تمثيلات المحول ثنائية الاتجاه) ومتغيراته - DistilBERT، RoBERTa، وELECTRA - بشكل مقارن لتصنيف نصوص الأخبار متعددة الفئات تلقائيًا. قام كل نموذج بأداء مهمة التصنيف من خلال تعلم الميزات السياقية والدلالية للنصوص المنتمية إلى فئات أخبار مختلفة. تم تحليل أداء النماذج استنادًا إلى مقاييس متنوعة مثل الدقة، والدقة الإيجابية، والاسترجاع، ودرجة F1. بين النماذج، أظهر نموذج DistilBERT أفضل أداء، محققًا دقة تبلغ 0.92 ومتوسط درجة F1 يبلغ 0.92. تكشف النتائج أن النماذج المبنية على المحولات تظهر أداءً قويًا في مهام تصنيف الأخبار وتوضح أيضًا تأثير الاختلافات الهيكلية بين هذه النماذج على نجاح التصنيف. وبناءً عليه، تم الحصول على رؤى مهمة حول الفعالية العملية لطرز نماذج اللغة المختلفة.
درس Şentürk وآخرون (الأربعاء) هذا السؤال.