Key points are not available for this paper at this time.
본 논문에서는 이미지 및 비디오 도메인에서 얼굴 검색을 위한 얼굴 이미지와 얼굴 비디오의 효과적이고 압축된 해시 표현을 생성하는 이질적 해싱 네트워크를 제안합니다. 이 네트워크는 얼굴 이미지와 비디오를 각각 공통 공간으로 투영하기 위해 이미지 지점과 비디오 지점으로 구성됩니다. 이후, 비선형 해시 함수가 공통 공간에서 학습되어 해당 이진 해시 표현을 얻습니다. 네트워크는 세 가지 손실 함수로 훈련됩니다: 1) 피셔 손실; 2) 소프트맥스 손실; 3) 삼중 순위 손실. 피셔 손실은 클래스 내 및 클래스 간 분산의 차이 형태를 사용하며, 미니 배치 기반 최적화 방법에 적합합니다. 피셔 손실과 소프트맥스 손실을 활용하여 공통 공간의 구분력을 강화합니다. 삼중 순위 손실은 최종 이진 해시 표현에 적용되어 검색 성능을 개선합니다. 대규모 얼굴 비디오 데이터셋과 두 개의 도전적인 TV 시리즈 데이터셋에 대한 실험을 통해 제안된 방법의 효과성이 입증되었습니다.
징 외 (Mon,)는 이 질문을 연구하였습니다.