融合大模型先验知识的强化学习作业调度优化方法及系统

AITNT
正文
推荐专利
融合大模型先验知识的强化学习作业调度优化方法及系统
申请号:CN202510843158
申请日期:2025-06-23
公开号:CN120743454A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种融合大模型先验知识的强化学习作业调度优化方法及系统,解决异构计算环境作业调度难题。本发明结合大模型知识推理与强化学习自适应能力,构建高效调度框架。训练初期,大模型据环境状态与作业需求生成初始调度动作,交互经验存入经验池;PPO算法利用经验池数据优化策略,更新网络参数,同时也会使用熵正则化维持一定的随机探索。大模型辅助训练后,PPO转为自主训练,与环境交互持续优化,最终生成适应性调度策略。本发明融合二者优势,显著提升训练效率和调度性能,平衡SLA与集群能耗,为复杂异构环境作业调度提供创新方案。
技术关键词
作业调度优化方法 模型训练模块 环境状态信息 策略更新 最大化资源利用率 算法 异构计算环境 集群 作业需求 更新网络参数 决策 定义 能耗 阶段 计算方法
系统为您推荐了相关专利信息
1
生物标志物模型训练方法、系统、电子设备及介质
模型训练方法 生物标志物 组织芯片 算法模型 基因
2
基于人工智能大模型的电解铝过程智能管理平台
智能管理平台 电解铝 设备状态数据 深度学习模型训练 数据处理模块
3
基于半监督生成对抗网络的脑部MRI图像翻译方法及装置
图像翻译方法 循环生成对抗网络 感知损失函数 神经网络架构 计算机可读指令
4
一种基于AI应用商店的医疗诊断系统及方法
诊断模块 模型训练模块 算法模块 商店 医疗诊断系统
5
光栅耦合器的设计方法、系统、计算机设备和存储介质
网络参数配置 模型训练模块 生成训练数据 深度神经网络 SOI结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号