摘要
本发明公开了一种基于强化学习的全局接口动态限流方法,包括以下步骤:S1、构建请求模拟器,通过请求模拟器将模拟请求发送至智能体;S2、采集状态信息,通过智能体根据当前的状态信息做决策,建立动作回报函数;S3、通过智能体随机选择动作,通过动作回报函数根据选择的动作得到回报值,建立Q函数;S4、通过深度神经网络对Q函数进行训练,根据最优的Q函数得到训练好的智能体;S5、通过训练好的智能体对模拟请求进行决策。基于强化学习的接口限流逻辑,可以让智能体学习到在不同负载,不同并发请求,以及在接口的访问序列有潜在统计规律的情况下,智能的决策是否对当前请求做限流还是放行。
技术关键词
动态限流方法
深度神经网络
模拟器
更新网络参数
梯度下降算法
接口
节点
决策
表达式
磁盘
数学
内存
逻辑
场景
标识
序列
误差
定义
系统为您推荐了相关专利信息
电力采集系统
多模态
预测装置
深度神经网络结构
传感终端
阀门控制单元
粒子群算法
低温液体蒸发器
监测方法
损失函数设计
多模态
图像语义分割模型
影像
特征提取模型
计算机可执行指令
人机协同
智能控制系统
决策
脑电信号采集设备
模型压缩