一种基于梯度强化策略优化的电力调度操作票审核模型动态微调方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510626072

申请日期：2025-05-15

公开号：CN120706502A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于梯度强化策略优化的电力调度操作票审核模型动态微调方法、系统、设备及存储介质，所述方法包括以下步骤：将电力调度规则库转换为可微分损失函数融入GRPO训练框架；提取文本语义与电网拓扑图特征，利用改进后的GRPO训练框架，基于蒙特卡洛搜索树MCTS进行预训练，生成符合电网物理约束的对抗样本模型；实时更新规则在线导入对抗样本模型；本发明聚焦规则动态嵌入与样本不平衡联合优化。

技术关键词

审核模型微调方法微调系统拓扑图电网拓扑约束策略电力调度系统语义特征动态蒙特卡洛防误闭锁学习设备文本传播算法梯度下降算法样本框架模块

系统为您推荐了相关专利信息

用于软件定义网络的控制器部署方法、设备及介质

软件定义网络位置优化方法时延网络控制器交换机

一种基于边缘算力感知的目标检测器鲁棒性微调方法

微调方法抑制算法鲁棒性检测器样本

一种基于长短链协同的巨星座分层多域路由方法及装置

综合效用函数节点长链分布式云 GEO卫星

一种工作票审核方法、装置、设备及介质

审核模型特征提取模块矩阵审核方法序列

基于多模态医疗数据的疾病预测分析方法

疾病预测分析方法多模态拓扑图疾病特征敏感度矩阵

一种基于梯度强化策略优化的电力调度操作票审核模型动态微调方法、系统、设备及存储介质

站点导航

APP 下载