摘要
本说明书提供一种代价函数的构建方法、计算机可读存储介质及程序产品,所述方法包括:根据目标驾驶变量确定对应的初始代价函数,所述初始代价函数中包含未知参数;获取针对所述目标驾驶变量的驾驶数据集合,所述驾驶数据集合包含所述目标驾驶变量的实际取值及其对应的代价观测值;根据所述驾驶数据集合确定所述未知参数的预估取值,并根据所述预估取值与所述初始代价函数构建目标代价函数。
技术关键词
强化学习框架
指标
数据
虚拟仿真平台
数值优化算法
可读存储介质
参数
计算机程序产品
变量
模板
处理器
非线性
线下
车辆
指令
关系
策略
系统为您推荐了相关专利信息
精密单点定位
协方差矩阵
卡尔曼滤波算法
方程
观测噪声
玉米种子活力
深度学习检测方法
序列
多头注意力机制
模型超参数
联邦模型训练方法
客户端
中间层
多层次
医疗影像数据
资源调度策略
混合预测模型
趋势预测模型
长短期记忆模型
资源调度方法