Key points are not available for this paper at this time.
تُدخل نماذج اللغة الكبيرة (LLMs) بشكل متزايد في بيئات العمل، بهدف تحسين الكفاءة والعدالة. ومع ذلك، فإن المخاوف قد تزايدت بشأن إمكانية عكس هذه النماذج أو تفاقمها للتحيزات الاجتماعية والأنماط النمطية. تستكشف هذه الدراسة الأثر المحتمل لنماذج LLMs على ممارسات التوظيف. للقيام بذلك، نجري تدقيقًا خوارزميًا لتحيزات العرق والجنس في أحد نماذج LLMs الشائعة الاستخدام، GPT-3.5 من OpenAI، مستلهمين من تاريخ التدقيق التقليدي للسير الذاتية. نجري دراستين باستخدام أسماء تحمل دلالات عرقية وجنسية متنوعة: تقييم السير الذاتية (الدراسة 1) وإنشاء السير الذاتية (الدراسة 2). في الدراسة 1، نطلب من GPT تقييم السير الذاتية بـ 32 اسمًا مختلفًا (4 أسماء لكل مجموعة من الجنسين و4 مجموعات عرقية) وخيارين مجهولين عبر 10 وظائف و3 مهام تقييم (التقييم الإجمالي، الرغبة في إجراء مقابلة، وإمكانية التوظيف). نجد أن النموذج يعكس بعض التحيزات استنادًا إلى القوالب النمطية. في الدراسة 2، نوجه GPT لإنشاء سير ذاتية (10 لكل اسم) لمرشحين وهميين لوظائف. عند إنشاء السير الذاتية، يكشف GPT عن تحيزات أساسية؛ حيث كانت السير الذاتية للنساء تحتوي على وظائف تتطلب خبرة أقل، بينما كانت السير الذاتية الآسيوية والإسبانية تحمل علامات المهاجرين، مثل اللغة الإنجليزية غير الأصلية والتعليم والخبرات العملية غير الأمريكية. تسهم نتائجنا في تنمية الأدب المتزايد حول تحيزات LLMs، لا سيما عند استخدامها في سياقات العمل.
درس أرمسترونغ وزملاؤه (يوم الثلاثاء) هذا السؤال.