摘要
本发明公开了一种基于AC强化学习的直流负载MOS管电压调节方法,包括:AC强化学习设计策略网络A和价值网络C;将调节动作与环境交互得到状态下的环境奖励,基于目的电流与调节后直流负载的电流值的差值设计奖励值;把新的环境状态输入策略网络A得到但不执行,再将、输入价值网络C得到t+1时刻的评价;利用价值网络C输出的以及环境奖励,通过TD算法得TD误差并计算损失函数,采用梯度下降算法更新价值网络C的模型参数使价值网络C的评价更精准;采用梯度上升来更新策略网络A的模型参数使输出的动作向折扣累计奖励更高的方向优化,从而实现栅极电压更准确地调节。
技术关键词
电压调节方法
MOS管
网络
策略
梯度下降算法
电流值
栅极
参数
误差
代表
序列
因子
定义
电子
系统为您推荐了相关专利信息
多模态深度学习
依赖特征
异常检测方法
学习方法
识别算法
数据处理方法
卷积神经网络提取
量子态
量子神经网络
局部空间特征
光伏发电功率
EEMD算法
分段预测方法
特征点
双向长短期记忆