摘要
本公开实施例公开了一种模型训练方法、装置、电子设备及存储介质,该方法包括:获取多个训练阶段的样本数据集,多个训练阶段按照样本数据集的训练难度由易到难进行排序;在各个训练阶段,基于样本数据集对初始模型进行训练,得到训练模型;将样本数据集输入至训练模型进行多轮推理,得到训练模型在每轮推理中输出的多个推理结果,基于各个推理结果的正确性,在多个推理结果中确定正负样本,基于正负样本对训练模型进行优化;对优化后的训练模型进行强化学习,得到目标模型,目标模型用于作为下一个训练阶段的初始模型,直至结束多个训练阶段;本公开实施例能够提升模型推理准确性。
技术关键词
模型训练方法
阶段
样本
文本
因子
数据
策略
模型训练装置
标签
电子设备
计算机程序产品
处理器
正面
可读存储介质
存储器
强度
模块
参数
系统为您推荐了相关专利信息
模型优化方法
采样模块
联合特征提取
卷积模块
局部特征提取
Stacking模型
光伏发电并网系统
频域特征
时域特征
逻辑回归模型
调用控制系统
OCR识别模型
调用控制方法
快捷键
终端
变邻域搜索算法
任务分配方法
多机器人任务分配
节点
均值算法
视觉问答方法
答案
特征提取网络
文本
注意力机制