Key points are not available for this paper at this time.
تروكيسينغ هي عملية استعادة معلومات الحالة للنصوص التي تم تنسيقها بشكل غير صحيح أو غير منسقة. تستكشف هذه الورقة قضايا التروكيسينغ وتقترح نموذجًا إحصائيًا قائمًا على نمذجة اللغة والذي يحقق دقة تصل إلى ~98% في مقالات الأخبار. تُظهر تقييمات المهام تحسنًا بنسبة 26% في مقياس F في التعرف على الكيانات المسماة عند استخدام التروكيسينغ. في سياق استخراج المحتوى التلقائي، يتم تحسين الكشف عن التلميحات في نصوص التعرف على الكلام التلقائي بمعدل 8 أضعاف. كما يعزز التروكيسينغ وضوح مخرجات الترجمة الآلية ويحقق تحسنًا في درجة BLEU بمعدل 80.2%. تجادل هذه الورقة بأهمية استخدام التروكيسينغ كعنصر قيّم في تطبيقات معالجة النصوص.
ليتا وآخرون (الأربعاء) درسوا هذا السؤال.