摘要
本发明属于汽车技术领域,具体的说是一种基于行为风险强化学习的智能汽车环岛驾驶决策方法。首先,分析并建立汽车横纵向耦合动作空间、包含驾驶任务‑周围环境‑自车信息的多尺度状态空间、考虑安全‑任务‑驾驶行为的多目标奖励函数。其次,通过应用多层感知机的自学习行为风险分类器,对智能体行为风险进行分类评定,并基于行为风险分类结果设计基于行为风险的策略优化目标,来优化强化学习驾驶决策算法,以解决奖励函数设计不足对于驾驶策略优化的影响,并引导驾驶决策朝向更安全方向收敛。
技术关键词
驾驶决策方法
智能汽车
策略
分类器
横摆角速度
车辆
危险工况
决策算法
多层感知机
困难样本挖掘
网络
联合损失函数
强化学习算法
高风险
分类准确率
偏差
车道
预测类别
系统为您推荐了相关专利信息
自动化控制方法
编码向量
波形
拓扑特征
测试电路板
自主导航避障方法
网络
确定性策略梯度
控制移动机器人
地图
语音情感识别方法
多任务
语音特征
梅尔频率倒谱系数
神经网络模型
连续反应器
计算机程序指令
语义角色
策略
自然语言
锂电池热失控
号码
AI图像识别
模型训练模块
参数