March 3, 2026Open Access

تصنيف الأخبار متعدد الفئات باستخدام نماذج معالجة اللغويات الطبيعية BERT، DistilBERT، RoBERTa، وELECTRA

Key Points

أظهر نموذج DistilBERT دقة متفوقة تبلغ 0.92 ودرجة F1 تبلغ 0.92، مما جعله في الصدارة في التقييم.
استخدم التحليل مقاييس بما في ذلك الدقة، والدقة الإيجابية، والاسترجاع، ودرجة F1 عبر فئات أخبار متعددة.
عرض التقييم المقارن لـ BERT، DistilBERT، RoBERTa، وELECTRA كفاءات تصنيف متباينة.
تشير النتائج إلى أن الاختلافات المعمارية بين نماذج المحولات تؤثر بشكل كبير على نتائج التصنيف.

Abstract

تتطلب الزيادة السريعة في مصادر الأخبار الرقمية اليوم التحليل والتصنيف الفعال للبيانات النصية على نطاق واسع. في هذه الدراسة، تم تقييم BERT (تمثيلات المحول ثنائية الاتجاه) ومتغيراته - DistilBERT، RoBERTa، وELECTRA - بشكل مقارن لتصنيف نصوص الأخبار متعددة الفئات تلقائيًا. قام كل نموذج بأداء مهمة التصنيف من خلال تعلم الميزات السياقية والدلالية للنصوص المنتمية إلى فئات أخبار مختلفة. تم تحليل أداء النماذج استنادًا إلى مقاييس متنوعة مثل الدقة، والدقة الإيجابية، والاسترجاع، ودرجة F1. بين النماذج، أظهر نموذج DistilBERT أفضل أداء، محققًا دقة تبلغ 0.92 ومتوسط درجة F1 يبلغ 0.92. تكشف النتائج أن النماذج المبنية على المحولات تظهر أداءً قويًا في مهام تصنيف الأخبار وتوضح أيضًا تأثير الاختلافات الهيكلية بين هذه النماذج على نجاح التصنيف. وبناءً عليه، تم الحصول على رؤى مهمة حول الفعالية العملية لطرز نماذج اللغة المختلفة.

Bookmark

View Full Paper

Bookmark

View Full Paper

تصنيف الأخبار متعدد الفئات باستخدام نماذج معالجة اللغويات الطبيعية BERT، DistilBERT، RoBERTa، وELECTRA

Key Points

Abstract

Cite This Study