一种基于数据集增强的领域大模型训练方法

AITNT
正文
推荐专利
一种基于数据集增强的领域大模型训练方法
申请号:CN202511341216
申请日期:2025-09-19
公开号:CN120849956B
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于数据集增强的领域大模型训练方法,包括根据领域需求定义数据规格并规划采集架构;采集通识、行业通用及专用多模态数据;对数据进行预处理、划分与标注;采用随机、基于模型及规则的增强方式生成高质量训练数据集;配置训练参数并动态调整学习率;分批加载数据进行前向与反向传播训练;根据训练与验证表现判断过拟合或欠拟合并相应调整;迭代训练至模型收敛;本发明通过将数据增强过程与领域知识及业务需求深度融合,并综合运用随机、基于模型和基于规则等多种增强策略,能够生成与真实业务场景高度契合、高质量、高可用性的训练样本,从根本上提升领域大模型的训练基础。
技术关键词
模型训练方法 高质量训练数据集 行业专用 样本 数学模型 训练集 并行处理数据 随机噪声 多模态 定制化数据 实体间关系 更新模型参数 调度器 初始化方法 多线程 优化器 数据抽样 音视频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号