摘要
本发明涉及一种数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统,方法包括:获取真实的交叉口车辆的交通轨迹数据,构建多个交互场景,提取各个时间步的观测信息,得到真实的车辆轨迹数据;以每个车辆作为智能体,基于预先按车辆类型构建的高斯策略网络,利用基于目标导向增益奖励以及来自判别器的奖励估计器计算奖励,生成模拟的车辆轨迹数据;基于所述真实的车辆轨迹数据和所述模拟的车辆轨迹数据,分别提取观察值‑动作对信息,以最大程度区分不同属性信息为目标更新智能体的判别器,同时,以最大程度混淆判别器为目标,更新生成器中的高斯策略网络和值估计器网络,实现基于多智能体对抗逆向强化学习的车辆复杂交互行为策略仿真。
技术关键词
交叉口车辆
车辆轨迹数据
仿真方法
策略
交通轨迹数据
网络
仿真模型
多层感知器
连续动作空间
仿真系统
代表
训练智能体
车道中心线
数据获取单元
数据处理单元
生成场景
系统为您推荐了相关专利信息
拖车系统
协调控制方法
飞机
补偿控制器
转向机构
智慧节能控制系统
云平台服务器
数据采集模块
大数据
数据分析模块
循环控制系统
指数
PID控制算法
序列
模糊控制算法
工业物联网设备
蜜罐部署方法
强化学习算法
交互模型
应对网络攻击