摘要
本发明涉及网络信息处理技术领域,公开了一种多任务协同学习驱动的多模态短视频信息预警方法和系统,用户输入短视频和提示词,输出短视频与提示词的匹配相似度,用户可以自定义相似度阈值,如果相似度达到或超过设定的阈值,则认为短视频匹配用户输入的场景描述,进行预警。本发明通过引入自定义提示词预训练模块、多任务训练策略以及互感多头协同注意力机制,旨在克服这些局限性,实现对短视频内容的全面理解和实时预警,显著提高模型的准确性、实时性和适应性。
技术关键词
图像特征向量
协同注意力
短视频
信息预警方法
特征提取模块
多任务
多模态特征融合
权重机制
文本
网络信息处理技术
场景
前馈神经网络
分支
序列
阶段
检测头
语义
系统为您推荐了相关专利信息
音视频推荐方法
生成特征向量
文本特征向量
时序
文字提取技术
诊断辅助系统
三维医学影像
子模块
模型训练模块
特征提取模块
点云分类方法
样本
深度学习模型训练
通道
多尺度特征融合