Key points are not available for this paper at this time.
버그 위치 지정을 목적으로 하는 대규모 소프트웨어 라이브러리에서의 검색 관점에서, 우리는 다섯 개의 일반 텍스트 모델과 몇 가지 복합 변형을 비교합니다. 일반 모델은 Unigram Model (UM), Vector Space Model (VSM), Latent Semantic Analysis Model (LSA), Latent Dirichlet Allocation Model (LDA), Cluster Based Document Model (CBDM)입니다. 이 작업의 목표는 소프트웨어 개발자가 텍스트 설명 형태로 보고한 버그와 관련 있는 파일을 찾는 것입니다. 우리는 75 KLOC와 많은 수의 버그(291)를 포함한 벤치마크 버그 위치 지정 데이터셋인 iBUGS를 연구에 사용합니다. 우리의 비교 연구의 주요 결론은 UM 및 VSM과 같은 간단한 텍스트 모델이 LDA와 같은 더 정교한 모델에 비해 라이브러리에서 관련 파일을 정확하게 검색하는 데 더 효과적이라는 것입니다. 다양한 모델의 검색 효율성은 다음 두 가지 메트릭을 사용하여 측정되었습니다: (1) 평균 정밀도; 및 (2) 순위 기반 메트릭. SCORE 메트릭을 사용하여 우리는 연구에서 모델의 검색 효율성을 다른 버그 위치 지정 도구와 비교합니다.
Rao et al. (Sat,)은 이 질문을 연구했습니다.