摘要
本申请公开了一种动作预测模型的训练方法、装置、设备及存储介质,属于计算机技术领域。该方法将车辆所处状态信息输入动作预测模型,由动作预测模型预测该状态信息下的合流动作以及奖励,且结合奖励的损失和动作的损失来进行模型训练,这样通过该方法训练出的动作预测模型预测的合流动作不仅向样本数据中的合流动作收敛,使得预测出的合流动作能够实现车辆的成功合流,且使得预测出的合流动作向奖励大的方向收敛,由于奖励也即指示合流效果,这样通过该方法训练出的动作预测模型预测的合流动作还能够提高合流效果,使得车辆更安全、高效地完成合流。
技术关键词
动作预测模型
样本
车辆
数据
仿真器
输入输出模块
计算机设备
计算机程序产品
处理器
场景
舒适度
加速度
训练装置
车道
可读存储介质
存储器
系统为您推荐了相关专利信息
数据融合方法
深度学习模型
拉丁超立方抽样方法
变压器磁场
三维仿真模型
特性识别方法
径流
GP模型
DBSCAN聚类算法
序列