Key points are not available for this paper at this time.
تُعد القراءة الآلية مهمة أساسية لاختبار قدرة فهم اللغة الطبيعية، والتي ترتبط ارتباطًا وثيقًا بالمعرفة البشرية في العديد من الجوانب. مع ارتفاع تقنيات التعلم العميق، تنافس النماذج الخوارزمية أداء البشر في أسئلة الإجابة البسيطة، وبالتالي تم اقتراح مجموعات بيانات قراءة آلية تتسم بالتحدي بشكل متزايد. على الرغم من إدماج تحديات مختلفة مثل دمج الأدلة والمعرفة العامة، إلا أن واحدة من القدرات الأساسية في القراءة البشرية، وهي التفكير المنطقي، لم يتم استكشافها بشكل كامل. قمنا بإنشاء مجموعة بيانات شاملة، تُسمى LogiQA، تم استمدادها من أسئلة كتبها خبراء لاختبار القدرة المنطقية البشرية. تتكون من 8,678 حالة سؤال وجواب، تغطي أنواعًا متعددة من التفكير الاستدلالي. تُظهر النتائج أن النماذج العصبية المتطورة تؤدي بشكل أسوأ بكثير من الأداء البشري. يمكن أن تُستخدم مجموعتنا أيضًا كمعيار لإعادة التحقيق في الذكاء المنطقي في سياق التعلم العميق لفهم اللغة الطبيعية. المجموعة متاحة مجانًا على https://github.com/lgw863/LogiQA-dataset.
درس جيان وآخرون (الأربعاء) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: