一种基于提示学习的多模态深度伪造视频检测装置及方法

AITNT
正文
推荐专利
一种基于提示学习的多模态深度伪造视频检测装置及方法
申请号:CN202510014022
申请日期:2025-01-06
公开号:CN120047865A
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于提示学习的多模态深度伪造视频检测装置及方法,包括将输入的视频数据切分成小片段,并提取视觉内容和音频信号;采用视觉深伪特征提取和预测模块进行视觉深伪特征提取并预测视觉模态的真伪;采用音频深伪特征提取和预测模块提取音频深伪特征并预测音频模态的真伪;多模态特征对齐模块,用于将视觉特征和音频特征在时间维度上进行对齐;跨模态特征匹配模块,用于将视频特征和音频特征进行帧级匹配,学习细粒度的音视频一致性特征;视频预测模块,用于多模态特征融合并预测视频的真伪。本发明针对多模态深度伪造视频设计了端到端的伪造检测装置,能够更有效的应对多模态伪造检测任务,提高视频造假的难度。
技术关键词
音频特征 伪造视频检测方法 视频检测装置 音频采样 对齐模块 多模态特征融合 视觉特征提取 样本 匹配模块 音视频 声谱 分类网络 跨模态 输出特征
系统为您推荐了相关专利信息
1
一种基于概率的多监视源目标的融合权重处理方法与装置
航迹信息 对齐模块 多模型滤波 平滑算法 卡尔曼滤波
2
一种基于注意力机制的水声生物目标识别方法
识别方法 样本 采样率 高斯核函数 生物
3
基于多模型间交互反馈的诊疗方法及装置
自然语言信息 诊疗方法 门控开关 大语言模型 多模型
4
基于Conformer的水下滑翔机声学数据处理方法及存储介质
水下滑翔机 数据处理方法 动态位置编码 多任务分类 音频特征
5
车辆后排乘员的脚部空间设计方法、装置、介质及设备
人体模型 脚部空间 乘员 空间设计方法 脚部尺寸
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号