车辆控制策略生成模型训练方法、设备、介质及程序产品

正文

推荐专利

申请号：CN202411822087

申请日期：2024-12-11

公开号：CN119807892A

公开日期：2025-04-11

类型：发明专利

摘要

本申请提出了一种车辆控制策略生成模型训练方法、设备、介质及程序产品。所述车辆控制策略生成模型包括Actor网络和Critic网络。该方法可以包括：获取样本时间步对应的样本行驶环境状态，分别将样本行驶环境状态输入肌肉记忆模型和车辆控制策略生成模型。Actor网络用于输出预测车辆控制动作概率分布；Critic网络用于输出预测价值估计；肌肉记忆模型基于车辆控制动作的先验知识训练得到，用于输出对应于样本行驶环境状态的目标车辆控制序列，目标车辆控制序列包括目标车辆控制动作与目标价值估计。基于目标车辆控制动作与预测车辆控制动作概率分布更新Actor网络的网络参数；基于目标价值估计和预测价值估计更新Critic网络的网络参数。

技术关键词

车辆控制策略网络记忆模型生成模型训练方法序列样本参数行驶状态信息预测误差处理器指令计算机程序产品生成方法可读存储介质电子设备存储器

系统为您推荐了相关专利信息

一种基于多模态大模型的音频生成方法

音频生成方法多模态音频编码器音频解码器文本编码器

基于SLIC的脉冲拨号检测方法、系统、介质及设备

脉冲定时器号码信号摘挂机

动力电池热失控风险评估方法、装置、电子设备及程序

动力电池热失控热失控风险单体神经网络模型风险评估方法

一种靶点相互作用的多维度优化筛选系统

筛选系统药物局部特征提取门控循环单元分子结构信息

一种网络设备安全连接装置

半导体制冷片网络设备散热腔散热组件散热翅片

车辆控制策略生成模型训练方法、设备、介质及程序产品

站点导航

APP 下载