基于质量感知与多尺度对齐的音视频深度伪造检测方法

正文

推荐专利

申请号：CN202511122479

申请日期：2025-08-12

公开号：CN121009341A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于质量感知与多尺度对齐的音视频深度伪造检测方法，包括如下步骤：对同步音视频序列进行编码，获得帧级视觉特征、面部动作单元与音素级语音表示；引入视觉质量评估模块生成空间可靠性掩码，对视觉特征进行质量加权；设计全局—局部多尺度跨模态对齐机制，在全局以双向跨注意力建模语音与面部动态同步，在局部将音素与面部动作单元进行生理耦合对齐；提出不确定性感知推理与校准方案，依据质量与一致性自适应温度缩放并以自监督损失进行不确定性校准。本发明解决了现有方法在低质量视频与高度同步伪造场景下鲁棒性不足及过度自信误判的问题，显著提升跨数据集泛化能力与实际部署可靠性。

技术关键词

面部动作单元视觉特征注意力音视频语义语音样本跨模态鲁棒性面部表情变化生理音频特征时序视频帧多尺度动态时间规整

系统为您推荐了相关专利信息

一种X:M动态注意力稀疏方法及装置

索引注意力稀疏方法处理单元 ASIC芯片

一种基于语义分割的飞机跑道自动标注方法

飞机跑道标注方法轮廓语义分割模型机场跑道

变压器冷却系统油泵异常检测方法、系统、设备及介质

变压器冷却系统油泵异常检测方法异常检测系统重构模块

事件抽取与语义信息增强方法及装置

门控循环单元门控神经网络语义 CRF模型标签

面向多模态数据的电力设备运检知识抽取方法及相关装置

面向多模态数据文本特征向量知识抽取方法图像特征向量多模态特征融合

基于质量感知与多尺度对齐的音视频深度伪造检测方法

站点导航

APP 下载