최근 Llm이 학습 데이터에 내재된 사회적 편견을 학습하여 성별, 인종 등에 대한 편향된 결과를 생성할 수 있다는 우려가 제기되고 있다. 윤리적인 LLM 개발을 위해 Llm이 보이는 편향에 대해 분석이 선행되어야 한다. 그러나 기존 연구는 일반적인 사회적 편향이나 단일 속성 중심의 분석에 집중되어 있으며, 도덕적 판단 상황에서 인구통계학적 속성이 미치는 영향을 체계적으로 분석한 사례는 드물다. 본 논문에서는 성별, 연령, 성적 지향 등의 속성이 Llm의 윤리적 판단에 미치는 영향을 정량적으로 비교하고, 특정 페르소나 설정이 판단 성능에 미치는 영향을 분석하였다. 실험 결과, 성적 지향 속성, 특히 동성애자 페르소나가 부여된 경우 가장 두드러진 윤리적 판단 성능의 저하가 나타났으며, 조합 속성과 하위 개념에서도 유사한 편향이 확인되었다. 본 연구는 도덕적 판단 상황에서 인구통계적 속성에 따른 체계적인 편향을 실증적으로 검토하고, 공정한 LLM 개발을 위한 기반을 제시한다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Hyeran Kang
Mirae Han
Harksoo Kim
Journal of KIISE
Building similarity graph...
Analyzing shared references across papers
Loading...
Kang et al. (Wed,) studied this question.
synapsesocial.com/papers/6a0ff2cdd674f7c03778b4a1 — DOI: https://doi.org/10.5626/jok.2026.53.5.412