车辆控制策略生成模型训练方法、设备、介质及程序产品

AITNT
正文
推荐专利
车辆控制策略生成模型训练方法、设备、介质及程序产品
申请号:CN202411822087
申请日期:2024-12-11
公开号:CN119807892A
公开日期:2025-04-11
类型:发明专利
摘要
本申请提出了一种车辆控制策略生成模型训练方法、设备、介质及程序产品。所述车辆控制策略生成模型包括Actor网络和Critic网络。该方法可以包括:获取样本时间步对应的样本行驶环境状态,分别将样本行驶环境状态输入肌肉记忆模型和车辆控制策略生成模型。Actor网络用于输出预测车辆控制动作概率分布;Critic网络用于输出预测价值估计;肌肉记忆模型基于车辆控制动作的先验知识训练得到,用于输出对应于样本行驶环境状态的目标车辆控制序列,目标车辆控制序列包括目标车辆控制动作与目标价值估计。基于目标车辆控制动作与预测车辆控制动作概率分布更新Actor网络的网络参数;基于目标价值估计和预测价值估计更新Critic网络的网络参数。
技术关键词
车辆控制策略 网络 记忆模型 生成模型训练方法 序列 样本 参数 行驶状态信息 预测误差 处理器 指令 计算机程序产品 生成方法 可读存储介质 电子设备 存储器
系统为您推荐了相关专利信息
1
一种基于多模态大模型的音频生成方法
音频生成方法 多模态 音频编码器 音频解码器 文本编码器
2
基于SLIC的脉冲拨号检测方法、系统、介质及设备
脉冲 定时器 号码 信号 摘挂机
3
动力电池热失控风险评估方法、装置、电子设备及程序
动力电池热失控 热失控风险 单体 神经网络模型 风险评估方法
4
一种靶点相互作用的多维度优化筛选系统
筛选系统 药物 局部特征提取 门控循环单元 分子结构信息
5
一种网络设备安全连接装置
半导体制冷片 网络设备 散热腔 散热组件 散热翅片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号