على الرغم من أن نماذج اللغة الكبيرة قد حققت تقدمًا كبيرًا في لغات متنوعة، لا تزال هناك مخاوف بشأن فعاليتها مع اللغات اللصقية ذات الموارد المنخفضة مقارنةً بلغات مثل الإنجليزية. في هذه الدراسة، ركزنا على اللغة الكورية، المعروفة بنهايات جملها المعقدة، وقمنا بتقييم نماذج اللغة الكبيرة في هذا الجانب الصعب. نقدم مجموعة بيانات نهايات الجمل الكورية (KoSEnd)، والتي تشمل 3000 جملة، كل منها معنونة بطبيعة 15 شكلًا من نهايات الجمل. تم جمع هذه البيانات من مصادر متنوعة لتغطية مجموعة من السياقات. قمنا بتقييم 11 نموذجًا للغة الكبيرة لتقدير فهمها لنهايات الجمل الكورية، وتحليلها بناءً على عدد المعاملات واتساق التنبؤات. ومن الجدير بالذكر أننا وجدنا أن إبلاغ النماذج حول احتمال فقدان نهايات الجمل قد حسّن الأداء، مما يبرز تأثير اعتبار بعض الميزات اللغوية بشكل صريح.
قام يو وآخرون (جمعة) بدراسة هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: