摘要
本发明提供一种多模态音视频数据检测方法和系统,在不损失识别精度的条件下,通过构建一种弱监督的架构来进行音频‑视频多模态融合检测,以此实现面向深度虚假音视频的检测,克服现有检测方法多侧重于单一模态的数据,很难全面检测包含不同模态的数据,以及现有检测方法无法应对将少量虚假信息插入到真实数据中的情形的问题。
技术关键词
切片
多模态
数据检测方法
音频特征
音视频
跨模态
序列
存储程序代码
检测器
sigmoid函数
标签
图像
特征提取单元
可读存储介质
特征提取器
处理器
系统为您推荐了相关专利信息
室内定位方法
跨模态
引入注意力机制
传感器
信号源
知识图谱构建方法
学科知识图谱
教学
融合知识图谱
生态
融合视觉特征
推理方法
图像
全局视觉特征
特征金字塔网络