网络调度模型训练的方法、装置、设备、介质及产品

AITNT
正文
推荐专利
网络调度模型训练的方法、装置、设备、介质及产品
申请号:CN202411513314
申请日期:2024-10-28
公开号:CN119476530A
公开日期:2025-02-18
类型:发明专利
摘要
本公开涉及机器学习技术领域,具体提供了一种网络调度模型训练的方法、装置、设备、介质及产品。其中,该方法包括:根据拉格朗日乘子、多个网络调度状态样本及其分别对应的网络调度动作,生成离线训练数据;根据离线训练数据,对强化学习模型进行参数调整;根据调整后的强化学习模型,更新拉格朗日乘子;若确定更新后的拉格朗日乘子符合收敛条件,则将调整后的强化学习模型作为训练好的目标网络调度模型,否则,根据更新后的拉格朗日乘子更新离线训练数据,并基于更新后的离线训练数据调整强化学习模型。这样,通过不断更新的离线训练数据进行模型训练,可以在兼顾模型性能的同时,减少训练成本。
技术关键词
强化学习模型 网络 计算机可读代码 离线 样本 数据 策略 拉格朗日对偶 机器学习技术 电子设备 可读存储介质 计算机程序产品 处理器 参数 指令 存储器
系统为您推荐了相关专利信息
1
一种用于光热功率预测的气象数据预测方法
人工神经网络 数据预测方法 插值模型 序列 滑动窗口
2
蓄电池组参数估计方法、装置、设备、介质及产品
参数估计方法 参数估计模型 蓄电池组 神经网络模型 放电起始电压
3
一种基于冗余电动助力转向系统的角度控制系统及方法
角度控制系统 助力转向系统 角度控制功能 信号 冗余
4
基于目标区域增强的机器视觉暗光目标检测方法及系统
语义分割模型 蒸馏 视觉 图像增强网络 光照
5
模型训练方法、推荐方法及相关设备
编码特征 模型训练方法 数据 对象 推荐方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号