Key points are not available for this paper at this time.
딥페이크 기술, 특히 오디오 분야의 발전으로 인해 디지털 보안 및 무결성을 유지하기 위한 강력한 탐지 메커니즘의 필요성이 대두되고 있습니다. 본 연구에서는 "스펙트로-시간 딥러닝 접근법을 통한 향상된 딥페이크 오디오 탐지"를 제시하며, 정교한 딥페이크 변조에서 진짜 오디오를 구별하는 도전 과제를 다루고자 합니다. 우리의 방법론은 다양한 오디오 클립을 포함하는 ADD2022 데이터세트를 활용하여 새로운 딥러닝 모델을 훈련하고 평가합니다. 접근법의 핵심은 오디오 샘플을 다시 샘플링하고 정규화하며 침묵을 제거하여 균일성을 보장하고 모델 입력 품질을 향상시키는 세심한 데이터 전처리 단계로 구성됩니다. 우리의 딥러닝 모델 아키텍처는 스펙트럼 특징을 추출하기 위해 합성곱 신경망(CNN)과 시간 동역학을 분석하기 위해 순환 신경망(RNN) 또는 장단기 기억망(LSTM)을 혁신적으로 결합합니다. 이 하이브리드 모델은 딥페이크 오디오의 특유의 미세한 변칙성을 식별하는 데 능숙합니다. 모델은 정확성, 정밀도, F1 점수, 재현율 및 동등 오류율(EER)과 같은 주요 지표에 대한 성능을 평가하면서 엄격한 훈련과 최적화를 거칩니다. 우리의 발견은 향상된 딥페이크 오디오 탐지 모델이 딥페이크 오디오를 식별하는 우수한 능력을 보여주며, 이는 디지털 오디오 변조와의 싸움에서 중요한 도구로서의 잠재력을 강조합니다. 이 연구는 디지털 포렌식 분야에 중요한 기여를 하며, 딥페이크 기술이 지배하는 시대에 오디오 콘텐츠의 진위를 보장하기 위한 확장 가능하고 효과적인 솔루션을 제공합니다.
A. Srinagesh (Sat,)가 이 질문을 연구했습니다.