摘要
本发明公开了一种短视频信息检测方法、装置、设备及存储介质,涉及网络空间安全信息检测技术领域,包括以下步骤:获取目标短视频中的多模态信息,提取各模态信息对应的多个模态特征;将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征;分别对与标题最相关的多个关键特征之间的一致性进行建模,得到第一融合特征表示以及第二融合特征表示;将第一融合特征表示、第二融合特征表示和标题特征进行拼接,得到多模态融合特征;对多模态融合特征进行分类,得到目标短视频中多模态信息的检测结果。本方法基于特征对齐和语义一致性建模,更好地挖掘并融合了短视频中的关键信息,大幅提升了信息的检测结果的准确性。
技术关键词
融合特征
信息检测方法
GRU模型
视频时空特征
短视频
字幕
模态特征
视频帧特征
音频
跨模态
注意力
矩阵
信息检测技术
信息检测装置
语义
多模态信息
序列
系统为您推荐了相关专利信息
构图结构
结构重构方法
强化学习模型
融合特征
变量
空间金字塔
多尺度特征
色彩校正
Sigmoid函数
融合特征