국내외적으로 사법부의 인공지능 활용이 늘어나고 있으며, 인공지능 판사에 대한 수요와 관심이 증가하고 있다. 사법부의 법적 의사결정을 지원하거나 제공하는 인공지능 판사에 관하여, 이 연구에서는 다음의 문제의식을 품게되었다. 먼저, 인공지능 판사가 기대만큼 공정한 판단을 내릴 수 있을지, 특히 과거 성범죄 판결의 젠더편향성을 고려할 때, 인공지능 판사가 2018년 성인지 감수성 판결의 법리에 따라 판결을 내릴 수 있을지에 대한 문제 제기였다. 그리고 이러한 문제의식을 직접 실험 연구를 통해 실증적으로 검증하고자 하였다. 먼저 LLM 기반 생성형 AI 모델인 ChatGPT를 인공지능 판사로 설정하여, 실험 1에서 2018년 성인지 감수성 법리를 제대로 이해하고 있는지에 관하여 실험하였다. GPT는 성인지 감수성의 의미를 비교적 일관되게 파악했지만, 주로 관점이나 태도와 같은 중간 수준의 개념으로 환원하였고, 정의와 형평의 원리로 개념화하는 데에는 다소 소극적이었다. 이 실험에서는 추가적으로, 다른 LLM 모델의 성인지 감수성 법리에 대한 이해를 추가함으로써 인공지능 모델별로 법리 이해와 그에 부여하는 규범적 지위와 강도가 달라질 수 있음을 도출하였다. 실험 2는 실제 판결의 인정된 사실관계를 대상으로 판결을 구했는데, 조건을 둘로 나누어 프롬프트 1에서는 일반적인 형사재판의 판단을 구하였고, 프롬프트 2에서는 성인지 감수성 판결의 법리는 적용하라는 추가적인 명령을 넣었다. 그 결과, 프롬프트 1의 응답은 전통적인 성폭력 통념에 근거하여 판단을 내렸지만, 프롬프트 2의 응답은 성인지 감수성 법리를 명시적으로 적용하고 언급하였다. 다만, 프롬프트 2의 응답조차 성인지 감수성에 대한 단순 언급에 그쳐 성인지 감수성 법리를 판단의 추론 요건으로 내재화하지 못하였다. 이는 판례 데이터 대다수가 전통적인 성폭력 통념에 기반한 데이터로 구성되어 있어, 성인지 감수성 법리가 요구하는 맥락적 해석을 판단 구조에 반영하지 못하였다고 볼 수 있다. 이러한 실험 결과에 근거하여, 마지막으로, 인공지능 판사가 공정하지 못하다면, 그러한 인공지능 판사의 젠더편향을 어떻게 교정할 수 있을지에 대한 방안도 제안하였다.
Joohyun Kim (Mon,) studied this question.