摘要
本申请公开了一种基于自适应轨迹微调的策略规划方法、装置、设备、介质及产品,涉及控制原理、自动化技术、数据处理领域,该方法包括获取策略规划的输入信息;根据自注意力transformer网络得到包含动态交互信息的环境上下文;利用采样方法得到自我智能体的多模态候选轨迹;利用候选轨迹周围的环境上下文信息对候选轨迹进行微调,并利用微调后的轨迹构建自我智能体的轨迹树;以自我智能体轨迹树中的每条轨迹为条件来预测周围智能体的未来轨迹,并构建场景树;在轨迹树和场景树上构建马尔科夫决策过程,使用花费函数评估轨迹树中每条候选轨迹的花费,选择花费最低的轨迹作为最优策略,提高了自我智能体策略规划的精度和对场景的适应性。
技术关键词
策略规划方法
轨迹
地图元素
锚点
条件预测方法
微调方法
采样方法
注意力
场景
细粒度特征
网络
坐标系
处理器
多模态
动态
模块
车道
计算机程序产品
系统为您推荐了相关专利信息
头戴式设备
风险预警方法
预测运动轨迹
速度因子
障碍物类别