摘要
本发明公开了一种安全交通流生成方法,包括如下步骤:S1、交通流仿真环境建模;S2、在线数据收集;S3、安全交通流驾驶行为建模:先使用当前策略收集训练数据,然后从数据中采集批量数据以更新价值网络、代价网络、策略网络。本申请设计一种奖励函数与代价函数,其中奖励函数是为了度量行驶效率,其设计主要从速度与碰撞角度来考虑的,速度越大奖励就会越大但如果发生碰撞对应的惩罚也会越大。设计代价函数是为了衡量当前行驶状态的安全性,代价函数是对TTC进行变换而来的,如果TTC较小表明当前状态不安全,那么代价就会较高。
技术关键词
交通流
生成方法
收集训练数据
网络
批量数据
策略
仿真环境
速度
在线
参数
广义
度量
算法
系统为您推荐了相关专利信息
分层控制系统
控制力矩
人工神经网络
比例积分微分控制
速度
食品包装
贝叶斯决策理论
深度强化学习算法
注意力机制算法
关键区域信息
指标预测方法
XGBoost模型
嵌入特征
实体
关系