一种用于社区能源管理的深度强化学习可解释规则提取方法

正文

推荐专利

申请号：CN202411033882

申请日期：2024-07-30

公开号：CN119089998A

公开日期：2024-12-06

类型：发明专利

摘要

本发明涉及一种用于社区能源管理的深度强化学习可解释规则提取方法，包括以下步骤：S10：训练专家模型，提取专家策略；S20：构建基于分离‑聚合机制的决策树集合可解释的学生模型DADT；S30：通过基于联合交互与动作价值评估的知识蒸馏方法提取专家策略，将S10获得的专家模型与S20获得的学生模型同时部署到控制环境中，与环境进行多轮交互迭代，在与环境交互迭代的过程中，使用动作价值函数Q函数实时评估专家模型与学生模型的价值，引入RF损失实现学生模型DADT策略的趋优更新，重新训练获得新的学生模型DADT；S40：提取决策树规则。本发明能够提高典型规则的决策性能，同时确保其可解释性。

技术关键词

规则提取方法深度强化学习能源管理学生知识蒸馏方法决策树规则调控策略回归树算法控制策略轨迹决策树模型训练集阶段机制控制系统样本节点典型

系统为您推荐了相关专利信息

一种数据分类方法、装置、电子设备及存储介质

深度强化学习模型数据处理模块数据分类方法精度数据处理单元

一种用于光伏故障检测模型压缩的联邦知识蒸馏方法

知识蒸馏方法故障检测模型学生教师数据分布

一种基于大数据驱动的日语教育精准学情分析实现方法及平台

学生语音识别模块教师考试系统大数据

基于多模态注意力数据分析课堂效果评估方法及系统

多模态注意力节点次级关键词知识点时间段

一种电力物联网设备管理系统和方法

电力物联网设备数据模块系统模块监测模块设备管理

一种用于社区能源管理的深度强化学习可解释规则提取方法

站点导航

APP 下载