Key points are not available for this paper at this time.
بينما تم استكشافها على نطاق واسع في المهام المعتمدة على النص، لا يزال الكشف عن الكيانات المسماة (NER) مهملاً إلى حد كبير في فهم اللغة المنطوقة. الموارد الحالية محدودة بمجموعة بيانات واحدة فقط باللغة الإنجليزية. تعالج هذه الورقة هذه الفجوة من خلال تقديم MSNER، مجموعة بيانات صوتية متعددة اللغات متاحة مجانًا ومعلّقة بالكيانات المسماة. توفر تعليقات على مجموعة بيانات VoxPopuli بأربع لغات (الهولندية، الفرنسية، الألمانية، والإسبانية). نحن أيضًا بصدد إصدار أداة تعليق فعالة تستفيد من التعليقات التلقائية المسبقة لتسريع عملية التنقيح اليدوي. وهذا يؤدي إلى 590 و15 ساعة من الكلام المعلم بالفضة للتدريب والتحقق، بالإضافة إلى مجموعة تقييم مكونة من 17 ساعة معلمة يدويًا. نقدم أيضًا تحليلًا يقارن بين التعليقات الفضية والذهبية. أخيرًا، نقدم نماذج أساسية لـ NER لتحفيز المزيد من الأبحاث حول هذه المجموعة البيانات الجديدة المتاحة.
ميوس وآخرون (Sun,) درسوا هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: