摘要
本发明提供了一种自动驾驶策略模型构建方法及自动驾驶策略生成方法,涉及自动驾驶技术领域,包括:获取车辆模型与预设行驶环境交互时的当前行驶数据;根据概率模型和变分自编码器构建自动驾驶模型和奖励函数;将当前行驶数据输入自动驾驶模型,得到驾驶策略动作,根据驾驶策略动作调节车辆模型的行驶状态,更新车辆模型的当前行驶数据,根据更新后的当前行驶数据和奖励函数确定驾驶策略动作的奖励;根据奖励优化自动驾驶模型,返回执行获取车辆模型与预设行驶环境交互时的当前行驶数据的步骤,对自动驾驶模型进行迭代更新,直至自动驾驶模型满足预设停止条件,得到训练好的自动驾驶模型。本发明有效提高自动驾驶策略动作生成准确性。
技术关键词
模型构建方法
驾驶策略生成方法
车辆模型
图像
加速度
编码器
数据
滤波器
雷达
强化学习算法
自动驾驶技术
特征提取网络
输入端
解码器
尺寸