摘要
本申请提出基于深度强化学习的电子负载拉载电流调节方法。基于强化学习架构,将电子负载拉载电流的调节过程模拟成一个马尔可夫决策过程,以拉载电流的高频时序信号作为环境状态,由智能体求解最优的MOS管栅极电压调节量序列;智能体选择多尺度跳转可分离卷积神经网络模型;将智能体预测的MCU调节量施加到电子负载后,根据实际电流跟目标电流的差值建立调节量奖励值,通过智能体多步调节建立训练数据集;基于对拉载电流的影响程度对奖励值序列施加权重建立奖励目标函数,基于梯度下降算法以奖励目标函数值最大为目标优化智能体参数。本申请提出的深度强化学习方法无需给训练样本打标签,减少人工参与,提高学习效率。
技术关键词
电流调节方法
电子负载
梯度下降算法
序列
卷积神经网络模型
智能体模型
时序
深度强化学习方法
栅极
双循环结构
参数优化方法
电压
MOS管
决策
多尺度
代表
信号
系统为您推荐了相关专利信息
情感分析系统
摘要
编码
语音特征提取
前馈神经网络
优化耳机
机器学习模型
滑动时间窗口
傅里叶变换处理
降噪模型
数字化仓储系统
汽车零部件
数据存储模块
数据分析模块
数据采集模块
图像去噪方法
正则化参数
优化算法技术
变量
二维图像矩阵