摘要
本发明涉及Serverless函数调度领域,具体提出了一种基于深度强化学习的Serverless函数调度方法。该方法通过模拟Serverless运行环境,采用近端策略优化(PPO)强化学习框架,PPO算法利用策略约束机制,维持模型更新稳定性并提升训练数据利用率。在模型训练阶段,智能体根据局部观测信息生成调度动作,同时将全局系统状态输入Critic网络进行联合价值评估,输出带权重修正的奖励信号。实际部署时,智能体基于训练完成的策略网络自主执行实例调度,快速响应调度请求。本发明以最小化响应时间和能耗为优化目标设置奖励函数,实现Serverless在动态资源和工作负载下的智能化函数调度。
技术关键词
深度强化学习
节点
函数执行时间
强化学习框架
集群
在线增量
资源
能耗
网络
仿真环境
内存
模型更新
调度系统
算法
动态
功耗
监控模块
机制
控制策略
系统为您推荐了相关专利信息
风电功率预测方法
形状控制器
概率密度函数
基准
模糊神经网络模型
机器翻译方法
文本
关系型数据库
字词
大语言模型
神经网络模型
编码模块
节点
注意力机制
学习方法
故障恢复策略
故障恢复方法
支路
配网
电网故障恢复