摘要
本申请公开了基于多模态特征的伪造视频判别方法、装置、设备及介质,涉及人工智能技术领域,方法包括:从视频中提取得到画面帧和音频;从画面帧中识别得到目标,进而确定目标的画面特征;识别音频的音频特征;根据画面特征和音频特征动态输出画面帧与音频关于时间同步性的第一权重、关于时空一致性的第二权重和关于检测不同层次特征是否异常的第三权重,并提取视频的时间序列特征;根据第一权重、第二权重、第三权重和时间序列特征判别视频是否经过伪造。本申请通过分析画面帧与音频关于时间同步性、分析画面帧与音频时空一致性和检测画面帧与音频不同层次特征是否异常,能够全面准确地检测视频是否经过伪造,提高了判别准确性。
技术关键词
时间序列特征
多模态特征
音频特征
判别方法
画面
视频
情感分类模型
情感特征
加速度
运动特征
自动语音识别
同步性
轨迹
特征提取模块
方位角
分析单元
分析模块
多层次
系统为您推荐了相关专利信息
输油管道监控
扩音器
对象识别模型
图像采集设备
画面
恢复面部
模型设计方法
感知损失函数
音频特征
音频编码
大语言模型
实体
生成知识图谱
关系
构建知识图谱
双向交互方法
音频特征数据
人工智能技术
上下文查询
老年人
状态评估方法
模式识别
网络安全状态
多模态特征
大数据