摘要
本发明涉及交通仿真技术领域,特别涉及一种基于闭环强化学习的自动驾驶交通流仿真方法及装置,其中,方法包括:基于预先构建的自动驾驶车辆为中心的交通流仿真框架获取真实驾驶数据集;根据真实驾驶数据集进行模仿学习预训练,以得到初始轨迹生成模型;根据初始轨迹生成模型构建闭环强化学习微调目标函数,并利用闭环强化学习微调目标函数对初始轨迹生成模型进行更新,以得到最终轨迹生成模型。由此,解决了现有技术存在或在真实性与可控性之间无法兼顾,或在闭环部署中面临协变量偏移、模式塌缩与训练不稳定等问题。
技术关键词
交通流仿真方法
闭环
轨迹
仿真框架
车辆
交通流仿真装置
地图特征
交通仿真技术
多模态
高层次
处理器
计算机程序产品
表达式
数据
可读存储介质
存储器
解码器
编码
场景
系统为您推荐了相关专利信息
ABS控制方法
矿用自卸车
惯性导航系统
轮速传感器
矿车
交通特征
交通流量预测
预测交通流量
时间段
数据分析模型
温度预测模型
热管理控制方法
热管理控制装置
热源
热管理控制器