摘要
本申请公开了一种基于强化学习的负载均衡方法、装置、电子设备及介质,涉及分布式系统领域,方法包括:接收并响应请求指令,根据请求指令获取系统的当前时刻状态信息,并基于状态‑动作价值对应信息、离散动作集和当前时刻状态信息确定预期累计奖励值集合,然后基于预期累计奖励值集合和预设限制条件确定目标动作,在确定目标动作之后,根据目标动作确定目标节点,以便目标节点响应请求。由此,该方法通过动态奖励机制和强化学习进行流量调度实时决策和节点的动态选择,解决了静态负载均衡在突发流量下响应滞后与局部过载的技术问题,达到了全局自适应负载均衡的技术效果。
技术关键词
负载均衡方法
系统响应时间
节点
错误率
分片
负载均衡装置
双曲正切函数
处理器
指令
电子设备
内存
可读存储介质
存储计算机程序
分布式系统
决策算法
计算机程序产品
因子
集群
模块
系统为您推荐了相关专利信息
动态配准方法
局部线性嵌入算法
流形学习算法
动态校正
节点
多模态特征
标签
多模态数据融合
情感交互方法
跨模态
节点
平台系统
数据安全
分布式协同
机器学习模型
编码器
生成方法
计算机可执行指令
生成框架
桥接结构