摘要
本申请提供了一种用于视频风险预测的方法、装置、电子设备、计算机可读介质和计算机程序产品。本申请的方法包括:获取待处理视频的文本特征信息;获取待处理视频的多个视频帧图像对应的视觉特征信息,所述视觉特征信息用于描述视觉内容的多维度特征;将所述文本特征信息和视觉特征信息进行融合处理,得到相应的融合特征信息;使用训练好的目标模型基于所述融合特征信息输出相应的风险预测结果。本申请通过将从视频中检测到的文本内容和和视觉特征信息进行融合,并基于融合后的信息来训练目标模型,使得模型能够更全面地理解视频内容,实现目标模型基于文本内容和视觉特征来输出相应的风险预测结果,提升了风险预测的准确性。
技术关键词
视觉特征信息
融合特征
视频帧
图像
文本
计算机程序指令
对象检测算法
计算机程序产品
风险预测方法
样本
特征提取模型
电子设备
场景
识别算法
处理器通信
系统为您推荐了相关专利信息
解码器模型
故障检测方法
智能工厂
编码器训练
学生
杂草图像
分割方法
像素点
感兴趣区域提取
拉普拉斯
图像拼接方法
融合特征
特征提取模块
卷积模块
特征提取网络