摘要
本发明公开了基于对比学习的多模态虚假新闻监测方法,属于虚假短视频新闻检测技术领域。包括以下步骤:基于CLIP文本多视图对比学习的特征提取器,设计一个VisualTheme模块进行视觉和文本特征特征提取,实现了对于关键帧和帧主题两种特征的提取和融合;基于文本、视觉和音频预训练特征提取器对短视频新闻中的标题、连续帧、音乐提取特征,实现了对非关键帧的其他模态特征的提取;利用所提取的多种模态特征设计一个多模态融合和分类器,将多模态特征作为输入,生成分类结果。设计一个文本多视图对比学习机制模块用来优化参数。本发明通过文本多视图提升多文本特征的互信息和语义一致性,学习多种文本视图的泛化特征,促进文本特征和其他模态融合。
技术关键词
关键帧
监测方法
文本
模态特征
关键词
主题特征
视觉特征
注意力机制
特征提取器
特征提取模块
音频特征
分类器
融合特征
短视频
特征提取模型
跨模态
前馈神经网络
系统为您推荐了相关专利信息
胸部CT图像
计算机断层扫描
模型构建方法
图文
大语言模型
关系
邻居
社交机器人
语义注意力
卷积神经网络学习
实体对齐方法
局部结构特征
多尺度
多模态信息
大规模知识图谱
布局方式
文字特征
图像生成方法
关键词特征
字体