调控策略的训练方法、调控动作的决策方法、装置及设备

正文

推荐专利

申请号：CN202410932128

申请日期：2024-07-11

公开号：CN119129952A

公开日期：2024-12-13

类型：发明专利

摘要

本申请公开了调控策略的训练方法、调控动作的决策方法、装置及设备，涉及人工智能技术领域。该方法包括：获取调控对象的第一状态数据；通过调控策略网络根据第一状态数据，生成第一动作数据，第一动作数据用于指示针对调控对象产生的对应于第一时刻的调控动作；在安全运行条件的约束下，校正第一动作数据，得到校正后的第一动作数据，安全运行条件是用于确保调控对象安全运行的条件；基于第一动作数据、校正后的第一动作数据和第一状态数据，调整调控策略网络的参数，得到更新后的调控策略网络。该方法在保证调控策略单步决策的安全性的同时，保证调控策略网络是向收敛的方向进行更新，使经过训练的调控策略网络的决策可以具有长期的安全性。

技术关键词

调控策略数据对象状态更新优化器决策方法神经网络模型参数计算机程序产品校正模块计算机设备数值人工智能技术处理器训练装置可读存储介质

系统为您推荐了相关专利信息

一种智能化多肽合成工艺优化的方法、设备及介质

多肽验证平台微反应器更新模型参数多通道注射泵

故障诊断模型的模型解析方法、装置、设备及存储介质

故障诊断模型模型解析方法节点队列术语

基于自然语言处理的医药文献数据智能分析方法及系统

数据智能分析方法医药主题分析模型自然语言主题集合

一种多病共存老人数据分析方法及系统

数据分析方法疾病年龄矩阵数据分析系统

一种基于光伏范围的精细化气象预测方法及系统

历史气象数据虚拟仿真平台训练样本集气象预测方法光伏组件模型

调控策略的训练方法、调控动作的决策方法、装置及设备

站点导航

APP 下载