摘要
本发明涉及计算机技术领域,可应用于金融科技和医疗健康领域,公开了一种伸缩策略模型生成及部署执行方法、装置、设备及介质,方法包括:构建硬件在环仿真环境,其中,所述硬件在环仿真环境用于模拟GPU推理服务的运行状态与性能指标,且在所述GPU推理服务时,所述硬件在环仿真环境中的关键指标与生产硬件环境中的关键指标的偏差在预设阈值内;在所述硬件在环仿真环境中,通过训练强化学习代理生成自动伸缩策略模型。提高了伸缩决策的准确度以及降低了伸缩策略模型训练的成本。
技术关键词
强化学习代理
仿真环境
模型生成方法
策略
伸缩控制器
决策
模型生成装置
副本
强化学习方法
指标
可读存储介质
医疗健康
处理器
执行装置
偏差
计算机设备
集群
存储器
系统为您推荐了相关专利信息
车辆通信方法
通信策略控制
车辆通信装置
数学模型
通信设备
健康知识图谱
健康风险评估
时序特征
小波神经网络
分层强化学习
多源异构信息融合
加权平均策略
融合多视角
强化学习模型
深度Q网络