摘要
本发明提供一种基于状态机的功率变换器强化学习控制训练方法,属于电力电子技术领域。包括以下步骤:S1、基于变换器指标构建状态机。S2、根据变换器特性搭建仿真环境,设计强化学习控制器。S3、在仿真环境中训练控制器,训练中,持续检测状态机,由此采取提前终止训练、延时终止训练、添加长期奖惩措施,重复直到完成训练。S1所述状态机是表征变换器运行情况的状态转移模型,包含待机、启动、正常和故障状态,且能描述状态转移关系。本发明在训练中监控状态机,触发高危故障则提前终止训练,触发低危故障则延时终止训练,长期正常运行则赋予额外奖励,降低负面样本影响,维持训练过程稳定,进而提升训练效率。
技术关键词
功率变换器
状态机
学习控制器
状态观测器
直流降压变换器
仿真环境
计算器
高风险
状态转移模型
电力电子技术
电压
PWM控制
仿真模型
待机
决策
指标
电感
系统为您推荐了相关专利信息
收发控制装置
时序控制模块
收发器
RS485总线接口
信号
稳定性调控方法
储能变流器
虚拟同步发电机
三相并网逆变器
线性化方法
数据传输控制模块
状态机
循环存储单元
轨迹
计算方法
汽车耐久性测试
永磁同步伺服电机
扩张状态观测器
滚珠丝杠
位置更新
智能调控系统
孔隙连通度
状态监测模块
状态机模型
异常状态