摘要
本说明书实施例提供一种基于强化学习的动态隔离业务处理方法,包括:构建以业务流量,资源利用率和延迟指标为参考的状态空间,以调整隔离级别,重新分配资源和触发扩容为参考的动作空间,以资源利用率,隔离效果,服务延迟为参考的奖励函数的强化学习模型;获取健康状态监测模块,资源管理状态和动作调整模块的指标数据,并对指标数据进行数据预处理,得到适配于强化学习模型格式的第一数据;将第一数据作为强化学习模型的输入,进行训练,得到目标模型。通过强化学习算法构建实时决策‑调节机制,能实时地实现动态业务处理和资源调配;采集多维度的信息数据,包括流量状态,资源状态,服务质量标等,提供充分的数据特征。
技术关键词
强化学习模型
计算机可执行指令
健康状态监测
动态
数据
指标
资源重分配
强化学习算法
策略更新
处理器
样本
模块
异常状态
错误率
可读存储介质
格式
存储器
系统为您推荐了相关专利信息
社区发现算法
生成代码
节点特征
数据输入模块
特征值
参数优化系统
工况
算法
动态融合机制
无人机控制技术
外观缺陷检测方法
电阻片
数据更新
数据存储模块
外观缺陷检测系统