摘要
本发明属于智能汽车技术领域,公开了一种考虑动作异步性的智能网联汽车高速公路合流决策方法,包括:S1.对智能网联汽车ICV和人类驾驶汽车HDV进行功能定义;S2.把混合交通下智能网联汽车高速公路合流决策表征为一个基于Stackelberg博弈的多智能体强化学习问题,设计考虑车辆动作异步性的时空序列马尔可夫决策过程;S3.构建Stackelberg博弈模型;S4.采用Actor‑Critic多智能体强化学习框架进行训练与评估。针对高速公路合流区车辆动作协同的异步性,本发明能有效提升智能网联汽车在混合交通下高速公路合流区的合流决策能力。
技术关键词
Stackelberg博弈模型
智能网联汽车
高速公路合流区
决策方法
多智能体强化学习
强化学习框架
车辆
动作协同
策略
车载通信模块
智能汽车技术
实时交通信息
多智能体系统
强化学习算法
笛卡尔坐标系
指标
PID控制器
网络
系统为您推荐了相关专利信息
智能体训练方法
人形机器人
面向多任务
混合编码器
校正策略
辅助决策系统
指标
数据管理模块
DCS系统
系统管理模块
智能运维方法
数字孪生体
多智能体协同
风电
实时数据采集
网络拓扑结构
预训练模型
智能决策方法
智能决策装置
集群
学习系统
强化学习模型
决策方法
计算机可读指令
网络