摘要
本申请公开了一种基于强化学习的模型输出控制方法,该方法包括:预先设置模型的输出数据,并采集模型的实时输出数据,输出控制模型判断模型的输出数据与预先设置的模型的输出数据是否存在差异,当模型的实时输出数据与预先设置的模型的输出数据不存在差异时,将模型投入应用;否则,通过强化学习模型学习预先设置的模型的输出数据,基于预先设置的模型的输出数据训练模型;采集训练后的模型的实时输出数据,通过输出控制模型判断训练后的模型的实时输出数据与预先设置的模型的输出数据是否存在差异;当训练后的模型的实时输出数据与预先设置的模型的输出数据不存在差异时,将训练后的模型投入应用。本申请具有模型输出的高度可定制化等优点。
技术关键词
输出控制方法
强化学习模型
数据
深度强化学习
判断方法
表达式
参数
系统为您推荐了相关专利信息
模型训练方法
降噪特征
差分编码器
生成特征
模型训练装置
信号处理器
控制器
实时监测系统
计算机设备
电压
姿态调节机构
导纳控制器
六轴平台
内焊机
阻抗控制器
水轮发电机磁极
励磁绕组
热网络模型
网络节点
热阻