一种基于强化学习的异构动态调度策略

正文

推荐专利

一种基于强化学习的异构动态调度策略

申请号：CN202510652713

申请日期：2025-05-21

公开号：CN120762830A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种基于强化学习的异构动态调度策略，包括以下步骤：首先将调度问题建模为马尔可夫决策过程，定义状态、动作、转移函数与回报函数，利用图卷积网络提取任务图结构特征并构建状态表示；通过策略网络输出动作概率分布，结合优势函数和熵正则化进行策略优化，同时使用价值网络估计状态价值并通过最小化贝尔曼误差进行训练；系统交互中，智能体根据状态选择任务调度动作并不断优化策略，最终实现最小化任务完工时间的目标。本发明能够在运行时根据系统状态做出分配和调度决策，显著提高了调度效率和适应性。

技术关键词

策略表达式任务调度网络优化网络结构设计异构节点特征算法随机梯度下降动态矩阵邻居定义资源决策计算机系统状态更新参数

系统为您推荐了相关专利信息

基于UnsatCore和强化学习的循环不变式模板生成方法

模板生成方法强化学习模型归因分析器决策

应用于智慧港口调度的业务数据挖掘方法及系统

数据挖掘方法港口设备去噪设备设备状态数据设备运行状态信息

多模态交叉校准的连续多代谢物监测方法

监测方法动态响应模型植入式生物传感器交互特征信号

基于博弈生成对抗网络的知识问答模型训练方法及系统

问答模型训练方法生成对抗网络答案知识点评估系统

基于强化学习的工商业园区共享储充系统智能调度方法

光储充系统储能设备负荷充放电策略智能调度方法

一种基于强化学习的异构动态调度策略

站点导航

APP 下载