网络调度模型训练的方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202411513314

申请日期：2024-10-28

公开号：CN119476530A

公开日期：2025-02-18

类型：发明专利

摘要

本公开涉及机器学习技术领域，具体提供了一种网络调度模型训练的方法、装置、设备、介质及产品。其中，该方法包括：根据拉格朗日乘子、多个网络调度状态样本及其分别对应的网络调度动作，生成离线训练数据；根据离线训练数据，对强化学习模型进行参数调整；根据调整后的强化学习模型，更新拉格朗日乘子；若确定更新后的拉格朗日乘子符合收敛条件，则将调整后的强化学习模型作为训练好的目标网络调度模型，否则，根据更新后的拉格朗日乘子更新离线训练数据，并基于更新后的离线训练数据调整强化学习模型。这样，通过不断更新的离线训练数据进行模型训练，可以在兼顾模型性能的同时，减少训练成本。

技术关键词

强化学习模型网络计算机可读代码离线样本数据策略拉格朗日对偶机器学习技术电子设备可读存储介质计算机程序产品处理器参数指令存储器

系统为您推荐了相关专利信息

一种用于光热功率预测的气象数据预测方法

人工神经网络数据预测方法插值模型序列滑动窗口

蓄电池组参数估计方法、装置、设备、介质及产品

参数估计方法参数估计模型蓄电池组神经网络模型放电起始电压

一种基于冗余电动助力转向系统的角度控制系统及方法

角度控制系统助力转向系统角度控制功能信号冗余

基于目标区域增强的机器视觉暗光目标检测方法及系统

语义分割模型蒸馏视觉图像增强网络光照

模型训练方法、推荐方法及相关设备

编码特征模型训练方法数据对象推荐方法

网络调度模型训练的方法、装置、设备、介质及产品

站点导航

APP 下载