Key points are not available for this paper at this time.
고립 단어의 엔드포인트를 정확하게 위치시키는 것은 신뢰할 수 있고 견고한 단어 인식을 위해 중요합니다. 엔드포인트 감지 문제는 화자, 녹음 환경, 전송 시스템에 의해 아티팩트(즉, 비음성 이벤트)가 도입될 수 있는 비정상적인 배경에서는 간단하지 않습니다. 다이얼 업 전화선으로 녹음된 고립 단어의 엔드포인트 감지 기술에 대한 여러 가지 기법이 연구되었습니다. 이 기술들은 개념적으로 명시적, 암시적 또는 혼합으로 널리 분류되었습니다. 엔드포인트 감지를 위한 명시적 기법은 인식 및 결정 단계 이전에 독립적으로 엔드포인트를 찾습니다. 암시적 방법의 경우, 엔드포인트는 시스템의 인식 및 결정 단계에 의해서만 결정됩니다. 즉, 엔드포인트 감지를 위한 별도의 단계가 없습니다. 혼합 기술은 명시적 및 암시적 방법 모두의 측면을 통합합니다. 조사 결과, 혼합 기술이 세 가지 연구된 클래스 중에서 단어 엔드포인트에 대해 일관되게 가장 좋은 추정을 제공하며, 그에 따라 가장 높은 인식 정확도를 제공함을 보여주었습니다. 손으로 편집된 엔드포인트에서 얻은 것에 가까운 인식 정확도를 제공하면서 0.5% 미만의 거부율을 부여하는 혼합 엔드포인트 감지기를 제안합니다.
Lamel et al. (Sat,)가 이 질문을 연구했습니다.