摘要
本发明公开了一种基于优质数据进行数据增强的大模型训练方法和装置,方法包括将基础数据输入自训练的词向量模型,生成对应的高维向量表示;将高维向量表示输入至移除位置嵌入的大模型中进行训练和调优,获得初步训练好的大模型;使用验证集对初步训练好的大模型进行性能评估,基于评估结果,对初步训练好的大模型进行多轮迭代训练,获得最终训练好的大模型。本发明通过优化数据输入和增强数据处理能力,提升大模型的有效性和精度,不仅解决了现有技术对大数据和大模型的过度依赖问题,还显著提升了大模型对优质数据的利用效率,增强了大模型的泛化能力和在实际应用中的表现,为大模型训练提供更具可操作性、更高效的技术路径。
技术关键词
模型训练方法
数据
模型训练装置
处理器
存储器
指令
基础
有效性
场景
电子设备
模块
精度
参数