본 연구는 의료 방사선 장비 품질관리(qa) 문서에 근거한 질의응답을 제공하는 검색 증강 생성(rag) 기반 챗봇을 제안한다. 제안 시스템은 (1) 질의 확장 기반 임베딩 기법을 적용하여 질문의 가상 응답을 생성·임베딩하고, (2) 다국어 환경에서의 불일치를 완화하기 위해 가상 응답을 영어로 정규화한 뒤 일관된 임베딩 ∙ 검색을 수행하며, (3) 메모리·파일 이중 캐싱을 결합하여 응답 지연과 모델 호출 비용을 절감한다. 임상 Qa 기준서와 검사 결과 문서를 전처리하여 약 2만 개 텍스트 단위로 구성하고, 벡터 검색 엔진으로 인덱스를 구축하였다. 평가 결과, 정확성 평균 점수는 3.66에서 4.83으로 향상되었고, 검색 실패율은 50% 이상에서 13.3%로 감소했으며, 평균 응답 시간은 3.5초에서 1.8초로 단축되었다. 응답 품질은 정확성·충실도·관련성·일관성·표현력·완결성의 6개 항목으로 정량 평가하였다. 시스템은 클라우드 실행 환경과 Gpu 연산 인프라에서 배포·운영 가능하며, 사용자 선호 데이터에 기반한 RLHF/Dpo 고도화를 향후 과제로 제시한다. 또한 본 연구는 실험 결과의 재현성을 확보하기 위해 총 120개의 평가 질의, 3인의 분야 전문가 평가자, 문서기반 근거 매칭을 포함한 표준화된 검증 절차를 적용하였다. 특히 질의 유형별 성능 분석을 수행하여 절차형·판단형·정의형 질의 등 다양한 기준에서 Rag 구조가 기존 단일 LLM 대비 우수함을 확인하였다. 이와 같은 결과는 의료 방사선 Qa 업무와 같이 고신뢰성 설명과 근거 기반 판단이 필요한 환경에서 제안 모델이 실질적 활용 가능성을 지님을 시사한다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ga-Heon Song
Jun-Woo Kang
Young-il Kim
Journal of the Korea Academia-Industrial cooperation Society
Building similarity graph...
Analyzing shared references across papers
Loading...
Song et al. (Tue,) studied this question.
www.synapsesocial.com/papers/69df2c01e4eeef8a2a6b1077 — DOI: https://doi.org/10.5762/kais.2026.27.3.748
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: