摘要
本申请公开了一种自适应血糖控制方法、装置、存储介质以及电子设备,涉及血糖控制技术领域,方法包括获取待血糖控制对象的当前血糖状态观测数据;根据待血糖控制对象的人群类别,对预先训练好的各深度强化学习调参网络模型进行筛选,得到与人群类别对应的满足预设稳定性约束条件的目标深度强化学习调参网络模型;采用目标深度强化学习调参网络模型针对当前血糖状态观测数据进行调参,得到动作参数调整量;基于动作参数调整量对血糖控制设备的PID参数进行更新。本申请将鲁棒稳定性分析结果嵌入目标深度强化学习调参网络模型的奖励函数,通过动态约束PID参数调整范围,并结合调参网络模型自适应优化控制策略,使PID系统在不确定性场景下始终保持稳定。
技术关键词
深度强化学习
PID控制参数
策略网络模型
策略优化方法
控制设备
不确定性参数
分析方法
对象
递归最小二乘法
动态
多项式
线性插值方法
优化控制策略
数据
闭环
顶点
电子设备
控制器
系统为您推荐了相关专利信息
策略网络模型
分层强化学习
运动规划方法
移动机器人
速度
深度强化学习算法
模拟测试环境
自动化测试脚本
生成测试用例结构
测试用例数据
学习训练方法
记忆
深度强化学习算法
末端执行器
阶段
采制检测装置
制样系统
煤样
检测设备
能源存储装置
多轴联动
工件接触区域
激光设备
工件接触状态
实体