摘要
本发明提供了一种基于深度强化学习的自动泊车路径规划模型构建方法、装置、设备及车辆,用于提高泛化能力并减少训练量。该基于深度强化学习的自动泊车路径规划模型构建方法,包括:构建泊车场景,泊车场景中包括墙体构成的停车区域以及位于停车区域内的本车、多个其他运动车辆、多个静止车辆构成的障碍物和多个停车位;构建深度强化学习网络;获取本车在泊车场景中的状态观测信息;将全局状态观测信息和局部状态观测信息输入到所构建的深度强化学习网络中,得到车辆的泊车执行动作;使用设定的反馈奖励函数指导深度强化学习网络迭代进行参数更新;在迭代次数达到预设次数后,得到所需求的自动泊车路径规划模型。
技术关键词
深度强化学习
自动泊车路径规划
模型构建方法
泊车场景
网络
障碍物
车辆
停车位
策略
运动
模型构建装置
坐标
参数
墙体
处理器
控制设备
输出模块
系统为您推荐了相关专利信息
多任务学习模型
粉尘检测方法
多尺度特征融合
模型训练模块
上采样
磨损监测系统
声发射
多模态数据融合
嵌入式智能
涂层结构
轮作模式
综合评价方法
油菜轮作
效应
结构方程模型
图像配准方法
监督学习模型
VGG网络
加权损失函数
像素点