融合大模型先验知识的强化学习作业调度优化方法及系统

正文

推荐专利

申请号：CN202510843158

申请日期：2025-06-23

公开号：CN120743454A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种融合大模型先验知识的强化学习作业调度优化方法及系统，解决异构计算环境作业调度难题。本发明结合大模型知识推理与强化学习自适应能力，构建高效调度框架。训练初期，大模型据环境状态与作业需求生成初始调度动作，交互经验存入经验池；PPO算法利用经验池数据优化策略，更新网络参数，同时也会使用熵正则化维持一定的随机探索。大模型辅助训练后，PPO转为自主训练，与环境交互持续优化，最终生成适应性调度策略。本发明融合二者优势，显著提升训练效率和调度性能，平衡SLA与集群能耗，为复杂异构环境作业调度提供创新方案。

技术关键词

作业调度优化方法模型训练模块环境状态信息策略更新最大化资源利用率算法异构计算环境集群作业需求更新网络参数决策定义能耗阶段计算方法

系统为您推荐了相关专利信息

生物标志物模型训练方法、系统、电子设备及介质

模型训练方法生物标志物组织芯片算法模型基因

基于人工智能大模型的电解铝过程智能管理平台

智能管理平台电解铝设备状态数据深度学习模型训练数据处理模块

基于半监督生成对抗网络的脑部MRI图像翻译方法及装置

图像翻译方法循环生成对抗网络感知损失函数神经网络架构计算机可读指令

一种基于AI应用商店的医疗诊断系统及方法

诊断模块模型训练模块算法模块商店医疗诊断系统

光栅耦合器的设计方法、系统、计算机设备和存储介质

网络参数配置模型训练模块生成训练数据深度神经网络 SOI结构

融合大模型先验知识的强化学习作业调度优化方法及系统

站点导航

APP 下载