模型训练方法、控制方法、设备、介质及程序产品

正文

推荐专利

申请号：CN202510754840

申请日期：2025-06-06

公开号：CN120633758A

公开日期：2025-09-12

类型：发明专利

摘要

本发明实施例公开了一种模型训练方法、控制方法、设备、介质及程序产品。该方法包括：获取训练样本集；将训练样本中的下一训练状态输入初始行动网络，得到初始行动网络输出的下一训练动作；将下一训练动作、训练样本中的当前训练状态、当前训练动作及下一训练状态输入初始价值网络，得到初始价值网络输出的当前目标Q值；若不满足迭代终止条件，则根据当前目标Q值，更新初始价值网络，得到更新后的初始价值网络，更新初始行动网络，得到更新后的初始行动网络，返回执行“获取训练样本集”的步骤；若满足迭代终止条件，则将初始行动网络确定为目标控制模型。该模型训练方法实现了目标控制模型的快速收敛以及提高了被控设备的稳定性。

技术关键词

模型训练方法网络训练样本集射频信号接收设备可读存储介质计算机程序产品电子设备处理器通信功率源存储器误差参数控制器数据

系统为您推荐了相关专利信息

面向复杂路况的多传感器融合协同式自动驾驶决策方法

自动驾驶决策方法道路场景图像传感器融合车道特征提取模块

一种薄壁件镜像铣削加工工艺参数优化方法及相关装置

工艺参数优化方法镜像参数优化装置粗糙度关系

设备连接方法以及相关设备

广播设备扫描设备队列接收信号强度指示算法

一种标签机走纸轮压力自动调节方法、设备及存储介质

压力自动调节方法标签机时间差事件时间间隔生成压力

一种基于自蒸馏的BEV视角3D目标检测方法及存储介质

蒸馏深度图学生教师上下文特征

模型训练方法、控制方法、设备、介质及程序产品

站点导航

APP 下载