一种基于世界知识模型的视频行为预测方法及系统

正文

推荐专利

申请号：CN202411564721

申请日期：2024-11-05

公开号：CN119068401A

公开日期：2024-12-03

类型：发明专利

摘要

本发明公开了一种基于世界知识模型的视频行为预测方法，包括：使用目标跟踪算法检测并跟踪视频中的物体，绘制目标采样轨迹；将目标采样轨迹转换为初步文本描述，并结合视频帧的时序信息，生成连贯的时序文本描述；将时序文本描述输入代理模型中，代理模型根据当前状态作为查询，从WKM中获取下一步动作的预测概率；代理模型结合其自身的预测概率和WKM给出的预测概率，进行加权融合，决定下一步动作。本发明通过构建WKM，结合了全局任务知识和局部状态知识，使模型能够适应不同任务和场景，提高了模型的泛化能力，并减少了智能体的无效行为和幻觉行为，从而提升了任务执行的效率和准确性。

技术关键词

轨迹三元组文本时序随机采样方法物体算法预测系统视频帧模块序列加速度数据模式关系计划索引规划坐标

一种基于世界知识模型的视频行为预测方法及系统

站点导航

APP 下载