摘要
本发明公开了一种基于深度强化学习的分布式环境下虚拟机调度方法,属于云计算资源调度技术领域。该方法通过构建混合动作空间联合决策机制,解决了传统方法在多目标优化及混合动作空间协同决策中的不足。具体包括:建立包含离散节点选择与连续资源分配的混合动作空间,采用动态掩码机制过滤无效节点,通过投影梯度下降确保资源配比约束;设计分层奖励函数实现多目标动态权衡,基于自适应权重策略动态调整能耗、负载均衡与SLA保障的优先级;提出多智能体协同框架,利用图注意力网络捕获跨节点拓扑依赖,结合LSTM编码时序负载特征,通过交叉注意力实现时空特征的动态融合;引入课程学习策略与优先级经验回放机制提升训练效率和策略鲁棒性。
技术关键词
虚拟机调度方法
交叉注意力机制
动态
深度强化学习
分布式环境
资源分配
多智能体协同
时序特征
云计算资源调度技术
长短期记忆网络
跨节点
编码
权重策略
负载特征
分布式虚拟机
系统为您推荐了相关专利信息
指令生成方法
工况
铝酸钠溶液
样本
生成对抗网络
区域配电网
配电网可靠性评估
综合评估模型
拓朴结构
节点
打桩机
北斗系统
状态观测模型
协方差矩阵
监控方法