一种基于优质数据进行数据增强的大模型训练方法和装置

正文

推荐专利

申请号：CN202411554692

申请日期：2024-11-01

公开号：CN119514653A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种基于优质数据进行数据增强的大模型训练方法和装置，方法包括将基础数据输入自训练的词向量模型，生成对应的高维向量表示；将高维向量表示输入至移除位置嵌入的大模型中进行训练和调优，获得初步训练好的大模型；使用验证集对初步训练好的大模型进行性能评估，基于评估结果，对初步训练好的大模型进行多轮迭代训练，获得最终训练好的大模型。本发明通过优化数据输入和增强数据处理能力，提升大模型的有效性和精度，不仅解决了现有技术对大数据和大模型的过度依赖问题，还显著提升了大模型对优质数据的利用效率，增强了大模型的泛化能力和在实际应用中的表现，为大模型训练提供更具可操作性、更高效的技术路径。

技术关键词

模型训练方法数据模型训练装置处理器存储器指令基础有效性场景电子设备模块精度参数

一种基于优质数据进行数据增强的大模型训练方法和装置

站点导航

APP 下载