摘要
本申请涉及自动驾驶技术领域,特别涉及一种基于离线强化学习和师生智能体的自动驾驶方法和系统,其中,方法包括:获取训练数据集,其中,训练数据集包括真实交通场景的驾驶数据;构建教师智能体,基于训练数据集,利用离线强化学习训练教师智能体;构建学生智能体,根据训练后的教师智能体的输出和训练数据集,利用模仿学习训练学生智能体;基于训练完成的学生智能体控制车辆进行自动驾驶。由此,解决了现有技术中泛化能力不足、监督学习方法的局限性、强化学习在实际应用中的高风险以及仿真与现实差异等问题。
技术关键词
教师
自动驾驶方法
车辆控制参数
策略
离线
道路交通环境
加速度
学生学习系统
轨迹
监督学习方法
方向盘
自动驾驶系统
自动驾驶技术
命令
数据采集系统
网络
处理器