摘要
本申请实施例提供了一种模型训练方法及装置,该方法包括:获取多个基站样本数据,基站样本数据包括:第一状态数据、第一动作数据、第一奖励数据、第二状态数据,第一状态数据是通过基础数据、设备用电数据、历史电费数据处理后得到的待稽核数据;第一动作数据是基于第一状态数据得到的动作数据;重复执行以下步骤,直至满足预设训练终止条件,得到目标神经网络模型:将第一状态数据输入至神经网络模型中,基于第一动作数据得到预测动作价值;将第二状态数据输入至神经网络模型中,得到第二状态数据对应的第二动作数据的目标动作价值;根据预测动作价值及目标动作价值,更新神经网络模型的权重,以根据更新后的权重训练神经网络模型。
技术关键词
数据
模型训练方法
训练神经网络模型
基站
样本
模型训练装置
收发机
存储计算机程序
计数器
处理器
基础
存储器
电子设备
模块
因子
数值
误差
系统为您推荐了相关专利信息
识别纸张
激光测距模块
异常数据
相关性分析方法
电子传感技术
赤芍饮片
机器视觉分选技术
偏最小二乘回归算法
形态学滤波
数字孪生体
数据分析模型
代码解释器
分析方法
报表
计算机设备