摘要
本发明公开了世界模型驱动的决策模型训练方法、系统、设备及产品,涉及人工智能技术领域。本方案通过目标视频数据和扩散生成模型生成初始世界模型,并使用基于三阶运动先验的扩散损失函数、动态损失函数和结构保持损失函数三种不同的损失函数对初始世界模型进行微调,实现了短期与长程预测的物理一致性和高频细节保真;进一步利用世界模型预测的不确定性自动生成奖励函数,提高了训练效率;根据目标视频数据和世界模型闭环训练决策模型,实现了环境认知与策略进化的协同优化;最后能够将训练完成的世界模型与决策模型整合至目标服务器,实现了感知‑决策‑运动执行的闭环控制,具备低延迟、高鲁棒性和易扩展性,提高了自动驾驶系统的安全性。
技术关键词
决策模型训练方法
环境感知数据
视频
轨迹生成系统
生成运动轨迹
轨迹参数
动态
序列
生成轨迹
服务器
样本
图像编码
闭环
车辆
系统为您推荐了相关专利信息
同步控制模块
双目相机
图像传感器
左右眼图像
时钟控制单元
智能分组方法
标签
关键字
场景
视频分类模型训练
无人机航拍视频
上下文查询
多尺度感知
救援场景
视觉特征