摘要
本发明公开了一种基于数据集增强的领域大模型训练方法,包括根据领域需求定义数据规格并规划采集架构;采集通识、行业通用及专用多模态数据;对数据进行预处理、划分与标注;采用随机、基于模型及规则的增强方式生成高质量训练数据集;配置训练参数并动态调整学习率;分批加载数据进行前向与反向传播训练;根据训练与验证表现判断过拟合或欠拟合并相应调整;迭代训练至模型收敛;本发明通过将数据增强过程与领域知识及业务需求深度融合,并综合运用随机、基于模型和基于规则等多种增强策略,能够生成与真实业务场景高度契合、高质量、高可用性的训练样本,从根本上提升领域大模型的训练基础。
技术关键词
模型训练方法
高质量训练数据集
行业专用
样本
数学模型
训练集
并行处理数据
随机噪声
多模态
定制化数据
实体间关系
更新模型参数
调度器
初始化方法
多线程
优化器
数据抽样
音视频