Key points are not available for this paper at this time.
코스 완료나 중퇴와 같은 학생 성과 예측은 온라인 교육에서 조기 개입의 핵심입니다. 이러한 맥락에서 학습 분석 시스템은 잡음이 많고 순차적이며 약하게 레이블이 지정된 상호작용 데이터에서 실행 가능한 인사이트를 추출해야 합니다. 우리는 상호작용 집합에서 중요한 사례를 선택하는 정책을 배우는 강화 학습 기반 다중 사례 학습(RL-MIL) 프레임워크를 다시 살펴봅니다. 그러나 이전의 RL-MIL 접근법은 맥락을 충분히 탐색하지 않고 사례 선택을 정당화하기 위해 비용이 많이 드는 사후 설명(예: SHAP)에 의존하는 엡실론-탐욕적 전략에 의존합니다. 우리는 주의 기반 RL-MIL 정책인 게이티드 어텐션과 멀티 헤드 어텐션을 제안하며, 이는 정책 네트워크에 맥락 인식 선택을 직접적으로 내장하여 추론 시 내재적 해석 가능성을 제공합니다. 두 가지 버전의 공개 대학 학습 분석 데이터 세트(OULAD)에 대한 실험 결과, 두 주의 기반 방법 모두 엡실론-탐욕적 기준선(집계 데이터 세트에서 0.92 Macro F1; 전체 데이터 세트에서 0.80)의 예측 성능과 일치하지만, 해석 지연 시간을 최대 두 자리 수로 줄이고 주의 온도 조정을 통해 희소성과 정확성 간의 조정 가능한 균형을 허용합니다. 이 작업은 약하게 레이블이 지정된 교육 환경에서 분석적이고 효율적이며 맥락 인식 사례 선택의 실행 가능성을 확립하고, 비용이 많이 드는 사후 방법에 의존하지 않는 확장 가능하고 해석 가능한 RL-MIL 프레임워크를 위한 경로를 제공합니다.
Braakman 외 (토요일), 이 질문을 연구했습니다.