摘要
本发明提供一种模型训练方法及装置,所述方法包括:基于当前迭代下的模型,预测当前批次下各样本的提议分布;基于各样本的提议分布与目标分布之间的差异,更新各样本的采样权重,各样本更新后的采样权重用于表征各样本对于模型训练的重要程度;基于各样本更新后的采样权重,以及各样本的提议分布与目标分布之间的差异,更新当前迭代下的模型参数。本发明中动态调整后的采样权重能够更准确地反映每个样本对模型训练的实际价值,并且兼顾了模型在各个样本上的预测误差,从而使模型能够更加关注高质量的样本,实现了在保证模型生成质量的同时,提升模型训练效率的目的,避免传统方法中因静态采样策略导致的效率低下和过度拟合问题。
技术关键词
模型训练方法
样本
非暂态计算机可读存储介质
模型训练装置
处理器
计算机程序产品
预测误差
参数
存储器
电子设备
策略
动态