一种基于深度强化学习的分布式环境下虚拟机调度方法

正文

推荐专利

申请号：CN202510617039

申请日期：2025-05-14

公开号：CN120540776A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了一种基于深度强化学习的分布式环境下虚拟机调度方法，属于云计算资源调度技术领域。该方法通过构建混合动作空间联合决策机制，解决了传统方法在多目标优化及混合动作空间协同决策中的不足。具体包括：建立包含离散节点选择与连续资源分配的混合动作空间，采用动态掩码机制过滤无效节点，通过投影梯度下降确保资源配比约束；设计分层奖励函数实现多目标动态权衡，基于自适应权重策略动态调整能耗、负载均衡与SLA保障的优先级；提出多智能体协同框架，利用图注意力网络捕获跨节点拓扑依赖，结合LSTM编码时序负载特征，通过交叉注意力实现时空特征的动态融合；引入课程学习策略与优先级经验回放机制提升训练效率和策略鲁棒性。

技术关键词

虚拟机调度方法交叉注意力机制动态深度强化学习分布式环境资源分配多智能体协同时序特征云计算资源调度技术长短期记忆网络跨节点编码权重策略负载特征分布式虚拟机

系统为您推荐了相关专利信息

一种蒸发工艺调控指令生成方法、系统、设备及介质

指令生成方法工况铝酸钠溶液样本生成对抗网络

一种考虑车网互动的区域配电网可靠性评估方法及系统

区域配电网配电网可靠性评估综合评估模型拓朴结构节点

基于北斗系统的桥梁打桩机监控方法及其系统

打桩机北斗系统状态观测模型协方差矩阵监控方法

针对支持算子层面操作的AI芯片的自动量化部署方法及系统

芯片动态库文件嵌入式系统框架格式

一种保险理赔视频帧的过滤方法、装置、设备及介质

过滤方法视频帧动态强化学习算法图像分割

一种基于深度强化学习的分布式环境下虚拟机调度方法

站点导航

APP 下载