Key points are not available for this paper at this time.
التعرف على الكيانات المسماة (NER) هو مهمة كلاسيكية في معالجة اللغة الطبيعية تهدف إلى استخراج معلومات ذات صلة ومحددة بالمجال (مثل البيانات الوصفية) من البيانات النصية. لتحقيق ذلك، المفتاح هو وجود كمية كافية من البيانات المعلّمة للكيانات التي نرغب في استخراجها، ويعتبر وضع علامات كافية لمجال محدد تحدياً مكلفاً، خاصة في مجالات علوم الأرض. واحدة من التقنيات الواعدة لزيادة حجم العلامات هي الاعتماد على تقنيات زيادة البيانات وهناك العديد من الأساليب التي يمكن استكشافها في هذا الاتجاه. أحد الاتجاهات هو الاعتماد على نماذج اللغة الكبيرة (LLMs) التي أظهرت مؤخراً تقدماً واعداً في مجالات مختلفة بما في ذلك زيادة البيانات. تعتمد هذه الدراسة على استخدام نماذج اللغة الكبيرة من خلال هندسة العبارات أو التوليد المعزز بالاسترجاع (RAG) للتغلب على صعوبات وضع العلامات لمهمة NER في بيانات علوم الأرض.
درس ميز وزملاؤه (الجمعة) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: