一种被控系统运行调度的高效率强化学习方法及装置

正文

推荐专利

申请号：CN202410798963

申请日期：2024-06-20

公开号：CN118674066A

公开日期：2024-09-20

类型：发明专利

摘要

本发明涉及强化学习领域，提供了一种被控系统运行调度的高效率强化学习方法及装置，方法包括：对被控系统的各状态‑动作对进行采样，根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量；利用采样数据分配算法确定各状态下各动作目标样本量；根据各动作目标样本量与各动作已消耗样本量，确定各动作补充采样数量；根据各动作补充采样数量进行补充采样，利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差；调整已消耗采样总量，判断已消耗样本总量满足动作采样数量约束条件，若是，则输出各状态下观测到的最优动作，本发明能够区分各状态动作的重要性，提升采样效率及优化策略性能。

技术关键词

样本因子强化学习方法总量算法高效率控制策略计算机设备稳态概率可读存储介质学习装置处理器分析单元数据项存储器噪声

系统为您推荐了相关专利信息

ITIH1在制备治疗肝细胞癌的药物中的应用

靶标药物小分子化合物蛋白基因

一种数据分类及标注方法及装置、电子设备、存储介质

数据格式标注方法数据分类特征提取单元深度学习算法

一种基于图像识别和分形学特征的电站水库状态跟踪方法

状态跟踪方法水库 Hurst指数高性能数字信号处理器边缘检测算法

一种胸痛智能分诊方法及系统

智能分诊方法患者病情信息胸痛图谱强化学习算法

一种基于电网友好型乡村综合能源系统分布式优化调度方法

分布式优化调度方法感知网络架构能源需求量特征提取模块能源设备

一种被控系统运行调度的高效率强化学习方法及装置

站点导航

APP 下载