第41卷第1期佳木斯大学学报(自然科学版)Vol.41No.12023年01月JournalofJiamusiUniversity(NaturalScienceEdition)Jan.2023文章编号:1008-1402(2023)01-0034-04高频特征与全局交互的人脸伪造检测①张萌萌,汪可馨(安徽理工大学计算机科学与工程学院,安徽淮南232001)摘要:人脸伪造技术在娱乐大众的同时也对多媒体信息安全造成了很大威胁。针对现有的人脸伪造检测技术未考虑图像内容交互及压缩处理丢失伪造痕迹的问题,提出了一个基于高频特征与全局交互的深度人脸伪造检测方法。首先,利用缩放局部自注意力机制捕获像素之间的空间交互,实现全局交互。其次,利用高通滤波器放大高频微妙伪影,提高对压缩伪造内容的检测准确度。最后,结合空间域与频域信息,最大程度地捕捉图像上下文信息,有效提高模型的泛化性。在FaceForensics++和Celeb-DF数据集的实验结果表明,所提出方法比之前的方法具有更好的检测效果和泛化性能。关键词:人脸伪造检测;频率;自注意力;泛化中图分类号:TP391文献标识码:A0引言随着深度学习的不断发展,以生成对抗网络(GenerativeAdversarialNetworks,GAN)、变分自编码器(VariationalAutoencoder,VAE)等为代表的人脸伪造技术生成的虚假图像和视频越来越难以通过肉眼进行分辨。此类伪造技术可带来商业价值,如移动端应用ZAO[1]为普通民众提供大众娱乐换脸服务。也会给个人和社会带来相应的风险和挑战。这些伪造技术在娱乐大众的同时也会被恶意滥用从而引发公众对社交媒体上的内容产生信任危机。因此,人脸伪造检测已成为多媒体信息安全领域的研究热点。目前,研究人员针对深度伪造视频检测问题展开了一系列的研究。传统的图像取证方法大多利用设备指纹、图像噪声[2,3]解决复制-粘贴、拼接等图像篡改技术。然而随着深度学习的发展,基于卷积神经网络(ConvolutionalNeuralNetworks,CNN)的伪造检测技术提取判别性特征实现检测的方法,渐渐超过了依赖特定类型篡改痕迹的传统取证方法。Nataraj等[4]发现GAN生成图像与自然图像的像素统计存在差异,通过在RGB三个颜色通道上提取共生矩阵检测假图。祝恺蔓等利用关键帧特征交互区分真假视频,先...