一种基于数据集增强的领域大模型训练方法

正文

推荐专利

一种基于数据集增强的领域大模型训练方法

申请号：CN202511341216

申请日期：2025-09-19

公开号：CN120849956B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于数据集增强的领域大模型训练方法，包括根据领域需求定义数据规格并规划采集架构；采集通识、行业通用及专用多模态数据；对数据进行预处理、划分与标注；采用随机、基于模型及规则的增强方式生成高质量训练数据集；配置训练参数并动态调整学习率；分批加载数据进行前向与反向传播训练；根据训练与验证表现判断过拟合或欠拟合并相应调整；迭代训练至模型收敛；本发明通过将数据增强过程与领域知识及业务需求深度融合，并综合运用随机、基于模型和基于规则等多种增强策略，能够生成与真实业务场景高度契合、高质量、高可用性的训练样本，从根本上提升领域大模型的训练基础。

技术关键词

模型训练方法高质量训练数据集行业专用样本数学模型训练集并行处理数据随机噪声多模态定制化数据实体间关系更新模型参数调度器初始化方法多线程优化器数据抽样音视频

一种基于数据集增强的领域大模型训练方法

站点导航

APP 下载