摘要
本发明公开一种短视频发布信息检测方法、系统、设备及介质,涉及人工智能与社交网络技术领域,该方法包括:采集短视频信息数据,提取短视频数据的多模态特征;将多模态特征融合,得到短视频特征的统一表示;抽取短视频关键帧;利用大型视觉-语言模型,从视频风格、视频内容和信息匹配的角度判别短视频的真实性,生成对应的推理依据和置信度等级;对推理依据与短视频特征进行交互增强;根据置信度等级评估不同推理依据的重要度;基于重要度聚合增强后的短视频特征与推理依据,得到用于最终分类的特征;该方法捕捉不同模态间的相互关系和补充信息,加强了视频信息检测器对辅助信息的感知,提高了检测准确度。
技术关键词
短视频
信息检测方法
关键帧
音频特征
多层感知机
视觉特征
检测计算机设备
注意力机制
多模态特征
社交网络技术
文本
信息检测系统
标签
数据
深度神经网络
可读存储介质
系统为您推荐了相关专利信息
稠密深度图
视觉里程计
深度神经网络
图像
优化场景
数据商品推荐方法
文本
深度学习模型
矩阵
计算机程序代码
回环检测方法
深度图
动态阀值
列表
深度优先搜索算法
森林火灾检测
融合多尺度特征
分支
特征金字塔网络
注意力
预测系统
达沙替尼
交互网络
标志物
敏感性检测试剂盒