一种被控系统运行调度的高效率强化学习方法及装置

AITNT
正文
推荐专利
一种被控系统运行调度的高效率强化学习方法及装置
申请号:CN202410798963
申请日期:2024-06-20
公开号:CN118674066A
公开日期:2024-09-20
类型:发明专利
摘要
本发明涉及强化学习领域,提供了一种被控系统运行调度的高效率强化学习方法及装置,方法包括:对被控系统的各状态‑动作对进行采样,根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量;利用采样数据分配算法确定各状态下各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量,确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差;调整已消耗采样总量,判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够区分各状态动作的重要性,提升采样效率及优化策略性能。
技术关键词
样本 因子 强化学习方法 总量 算法 高效率 控制策略 计算机设备 稳态概率 可读存储介质 学习装置 处理器 分析单元 数据项 存储器 噪声
系统为您推荐了相关专利信息
1
ITIH1在制备治疗肝细胞癌的药物中的应用
靶标 药物 小分子化合物 蛋白 基因
2
一种数据分类及标注方法及装置、电子设备、存储介质
数据格式 标注方法 数据分类 特征提取单元 深度学习算法
3
一种基于图像识别和分形学特征的电站水库状态跟踪方法
状态跟踪方法 水库 Hurst指数 高性能数字信号处理器 边缘检测算法
4
一种胸痛智能分诊方法及系统
智能分诊方法 患者病情信息 胸痛 图谱 强化学习算法
5
一种基于电网友好型乡村综合能源系统分布式优化调度方法
分布式优化调度方法 感知网络架构 能源需求量 特征提取模块 能源设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号