摘要
本发明提供一种视频未来事件预测方法、装置、存储介质和程序产品,其中方法包括以下步骤:输入视频和视频内容描述;将视频拆分为视频片段;从视频片段中过滤出视频关键片段和视频关键帧;采用因果注意力机制,从视频关键片段和视频关键帧中提取影响未来事件的信息;构建思维推理链,引导模型;通过语言生成模型解码,预测视频未来事件。本发明克服了在处理复杂的、多变的现实世界场景时的局限性,增强了对复杂场景和细微变化的理解能力,实现了对复杂视频数据的深度分析和未来事件的准确预测,提高了在未来事件预测方面的准确性和可靠性,能够基于当前数据预测长期趋势和潜在风险,为决策提供更全面的支持。
技术关键词
事件预测方法
视频
关键帧
令牌
视觉特征
语义特征
多头注意力机制
计算机装置
指令
计算机程序产品
处理器
解码
序列
可读存储介质
存储器
逻辑
场景
系统为您推荐了相关专利信息
视觉辅助定位
卫星定位信息
双层卷积神经网络
辅助定位方法
定位参考点
生命探测仪
处理器
视频
人脸识别技术
面部关键点检测
SLAM算法
特征点
关键帧
实例分割模型
一致性算法
监测识别系统
集群服务器
列车
深度学习服务器
视频监控服务器
避障路径
周围环境信息
管控方法
位置偏差量
轨迹预测模型