Key points are not available for this paper at this time.
深度伪造是一种恶意技术,将目标面孔移植到视频中的原始面孔,导致严重的问题,如侵犯版权、信息混淆甚至公共恐慌。之前针对深度伪造视频检测的努力主要集中在外观特征,这些特征容易被复杂的操控所绕过,同时导致模型复杂性高和对噪声的敏感性。此外,如何挖掘被操控视频的时间特征并加以利用仍然是一个未解决的问题。我们提出了一种名为LRNet的高效且稳健的框架,通过对精确几何特征进行时间建模来检测深度伪造视频。设计了一种新颖的校准模块,以增强几何特征的精度,使其更具辨别力,并构建了一个双流递归神经网络(RNN),以充分利用时间特征。与之前的方法相比,我们提出的方法更轻量且更易于训练。此外,我们的方法在检测高压缩或噪声腐蚀的视频时表现出稳健性。我们的模型在FaceForensics++数据集上取得了0.999的AUC。同时,当面对高度压缩的视频时,其性能优雅地下降了(-0.042 AUC)。
孙等(星期二)研究了这个问题。