摘要
本发明涉及智能体控制技术领域,具体涉及一种基于特权模仿学习的无人系统端到端轨迹规划方法及系统,包括:构建专家网络与学生网络,将所述训练场景障碍物的位置并作为特权信息,基于所述特权信息构建避碰约束设计;在所述专家网络中以训练目标轨迹点为目标输出专家轨迹;在所述学生网络中,通过无人系统按预设间隔获取所处环境的图像进行模仿学习训练并输出预测轨迹,其中,所述学生网络内设有感知融合编码模块;基于学生网络输出的预测轨迹与所述专家轨迹作为模仿学习损失;基于学生网络对对待规划任务进行预测得到无人系统运动轨迹。相较于现有技术,本发明突破了传统方法对全局地图的依赖。
技术关键词
轨迹规划方法
学生
网络
系统动力学模型
编码模块
训练场景
障碍物
智能体控制技术
控制点
轨迹参数
图像
轨迹规划系统
表达式
全局地图
处理器
曲线
计算机设备