Key points are not available for this paper at this time.
حظي فك الشيفرة بأقل مخاطر بايز (MBR) مؤخراً باهتمام متجدد في توليد النصوص. يأخذ فك الشيفرة MBR النصوص المأخوذة من نموذج كنصوص مرجعية زائفة ويختار النص الأكثر تشابهاً مع الآخرين. لذلك، يعتبر أخذ العينات أحد العناصر الرئيسية في فك الشيفرة MBR، وأفادت الدراسات السابقة بأن الأداء يختلف وفقاً لطرق أخذ العينات. من وجهة نظر نظرية، من المحتمل أن يكون هذا الاختلاف في الأداء مرتبطاً بمدى قرب العينات من التوزيع الحقيقي للمراجع. ومع ذلك، لم يكن هذا الاقتراب موضوع دراسة معمقة. في هذه الدراسة، نقترح استخدام كشف الشذوذ لقياس درجة الاقتراب. نقوم أولاً بفحص دقيق للاختلاف في الأداء ثم نظهر أن الفرضيات السابقة حول العينات لا تتوافق جيداً مع هذا الاختلاف، لكن درجات الشذوذ التي نقدمها تتوافق. النتائج هي الأولى التي تدعم تجريبياً الرابط بين الأداء والافتراض الأساسي لفك الشيفرة MBR.
درس أوهاشي وزملاؤه (Sun) هذا السؤال.