摘要
本申请涉及一种交通场景封闭场地集群模拟、装置、设备及介质,包括:建立交通参与者博弈效用矩阵;将交通参与者博弈效用矩阵引入最大熵逆强化学习模型,构建多交通参与者交通行为模型;通过交通参与者交互数据集训练该模型,得到逆强化学习交通参与者动态博弈模型;搭建实物场景、虚拟仿真场景和数据交互链路;采用虚实结合的方法,在虚拟仿真场景中通过逆强化学习交通参与者动态博弈模型对多个第二交通参与者进行交通行为模拟,并通过数据交互链路控制多个第一交通参与者的动作轨迹。本申请的技术方案能够利用目标物在实物场景中实现多个交通参与者交互博弈交通行为的逼真模拟,以实现对自动驾驶系统的精确测试,提升自动驾驶系统的性能。
技术关键词
交通
仿真场景
强化学习模型
动态
自动驾驶系统
仿真环境
时效性
链路
数据
矩阵
安装定位设备
仿真平台
网络架构
车辆
轨迹
训练集
计算机设备
集群
策略
系统为您推荐了相关专利信息
节点
需水预测方法
居民
序列
Softmax函数
筛查方法
风险预测模型
药物
医院信息系统
电子处方系统
收费管理系统
需求预测模型
深度强化学习
异构特征
计费