摘要
本发明提供一种基于后继特征与迁移强化学习的队列巡航控制方法,涉及智能网联车辆领域,由于采用了异质网络分支和共享主干网络的双层网络结构,提取异质多智能体状态转移数据的状态转移特征和异质奖励函数,并在状态转移特征的基础上构建反映全区域内Q值分布的后继特征,并进一步提出迁移强化学习方法,有效解决了现有技术中智能体异质性导致多智能体强化学习算法训练成本较高、难以对异质ICV队列的CACC任务实时快速部署、性能优化效率较低的问题,进而实现了目标域异质智能网联车辆CACC的强化学习性能快速启动的效果,最终使得实时ICV队列的CACC任务,能够凭借后继特征的知识迁移,达成快速启动的性能。
技术关键词
后继特征
巡航控制方法
异质
智能网联车辆
策略
队列
特征提取网络
分支
神经网络参数
多智能体强化学习
双层网络结构
数据平台
变量
强化学习方法
代表
纵向动力学
神经网络结构
系统为您推荐了相关专利信息
噪声数据
噪声分析方法
智能分析装置
声音采集设备
视频特征数据
补丁
评分机制
蚁群优化算法
深度神经网络架构
构建深度神经网络
金属纤维
梯度复合材料
卷曲
合金棒材
树形支撑结构
网络流量特征
数据访问模式
节点优化方法
分片策略
异构