Key points are not available for this paper at this time.
تعتمد العديد من أنظمة معالجة اللغة الطبيعية الحديثة على تضمينات الكلمات، التي تم تدريبها مسبقًا بطريقة على مجموعات كبيرة من البيانات، كميزات أساسية. ومع ذلك، لم تكن الجهود المبذولة للحصول على تمثيلات لجزيئات نصية أكبر، مثل الجمل، ناجحة. لم تصل عدة محاولات لتعلم تمثيلات غير خاضعة للإشراف إلى أداء مرضٍ بما يكفي ليتم استخدامها على نطاق واسع. في هذه الورقة، نوضح كيف أن تمثيلات الجمل العالمية المدربة على بيانات إحصائية من مجموعات بيانات استدلال اللغة الطبيعية في جامعة ستانفورد تتفوق باستمرار على الأساليب غير الخاضعة للإشراف مثل متجهات SkipThought في مجموعة من مهام النقل. تمامًا كما تستخدم رؤية الكمبيوتر ImageNet لميزات، التي يمكن نقلها إلى مهام أخرى، تميل أعمالنا إلى الإشارة إلى ملاءمة استدلال اللغة الطبيعية لتعلم النقل لمهام معالجة اللغة الطبيعية الأخرى. مشفرنا متاح للجمهور.
قام كونيو وآخرون (الجمعة) بدراسة هذا السؤال.