摘要
本发明公开了一种基于强化学习探索变频器的最优驱动参数的方法,包括构建探索变频器最优驱动参数的强化学习模型;将探索最优驱动参数的阶段按照预设最大迭代次数划分为三个阶段;根据变频器的所有个体参数构建种群,并根据种群的多样性、收敛性和适应度的变化指标的正负组合关系定义种群的多种状态标签;建立包含多种候选动作的动作池,将多个候选动作与每种状态标签绑定,并将多种状态标签赋值于强化学习模型的各阶段;将ε‑贪心动作选择策略和阶段奖励函数分配于强化学习模型的各个阶段,完成模型构建;初始化种群,将种群赋值于构建完成的强化学习模型强化学习模型将适应度最高或最低的个体参数作为最优驱动参数输出,驱动变频器运行。
技术关键词
强化学习模型
标签
分段线性函数
变频器
阶段
指标
参数
进化算法
策略
方程
定义
关系
数值
动态
系统为您推荐了相关专利信息
电力物联网终端
攻击溯源方法
节点
残差生成器
残差生成对抗网络
融合识别方法
可见光图像
深度视觉特征
身份
非暂态计算机可读存储介质
人脸图片
生成游戏
损失函数优化
标签
训练特征提取模型