摘要
本发明涉及机器学习与自动驾驶技术领域,公开了一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质,所述方法包括:构建与自动驾驶风险对应的广义风险函数,将广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据增广状态和所述原始状态空间构建增广状态空间,构建风险敏感驾驶策略模型,基于增广状态空间向量对风险敏感驾驶策略模型进行优化,得到目标模型;根据当前原始状态空间和当前增广状态构建当前增广状态空间向量,将当前增广状态空间向量输入到目标模型,输出控制指令,并根据控制指令完成自动驾驶控制。本发明保证决策过程的时间一致性,显著提升行车安全性,有效规避碰撞等高风险事件。
技术关键词
自动驾驶决策方法
策略
广义
车辆传感器
决策系统
动态
网络
控制执行模块
变量
自动驾驶技术
随机梯度下降
可读存储介质
处理器
终端
高风险
交通
存储器
计算机
刹车
系统为您推荐了相关专利信息
任务分配策略
多智能体协同
光伏电站智能
设备状态评估
实时监测数据
服务调度方法
容器
混合调度策略
网络互通
资源分配信息
高精度预测方法
样本
变量
随机森林模型
梯度提升模型