摘要
本发明公开了基于深度强化学习的异构计算多目标自适应任务调度方法,包括如下步骤:S1、构建异构计算环境的多维度动态感知模型,实时采集计算节点性能指标、任务特征参数及网络状态;S2、定义奖励函数为多目标加权组合,融合任务完成时间、能源消耗、资源利用率及成本,权重由模糊综合评价算法动态调整;S3、建立基于注意力机制的双通道深度强化学习网络架构;S4、建立自适应探索机制,结合ε‑贪婪策略与熵正则化,平衡探索与利用;本发明的有益效果:通过深度强化学习与多目标优化的结合,实现任务完成时间、能耗、资源利用率等多指标的动态平衡,采用双通道网络与交叉注意力机制,同时建模任务时序特征和拓扑依赖关系,使调度策略更精准。
技术关键词
深度强化学习
任务调度方法
模糊综合评价
异构计算环境
交叉注意力机制
网络架构
TOPSIS算法
贪婪策略
动态
双通道信息
时序特征
资源
时间卷积网络
混合编码器
故障容错
系统为您推荐了相关专利信息
交叉注意力机制
视觉导航方法
融合视觉导航
模块
视觉特征
注意力神经网络
安全监控方法
患者康复训练
跌倒检测传感器
决策
隐马尔可夫模型
存储方法
加密算法
模糊综合评价方法
存储设备
新能源汽车充电站
光储充一体化系统
储能模块
负荷
面向新能源消纳