一种基于自回归训练的语言模型优化方法及相关设备

AITNT
正文
推荐专利
一种基于自回归训练的语言模型优化方法及相关设备
申请号:CN202510741088
申请日期:2025-06-05
公开号:CN120258047B
公开日期:2025-08-26
类型:发明专利
摘要
本申请提供一种基于自回归训练的语言模型优化方法及相关设备,方法包括:构建语言模型的自回归训练框架,基于输入的历史上下文预测后续词的概率分布,其中每一代自回归训练中的概率分布用于生成下一代的合成数据;在每一代训练中,按设定比例将真实数据与上一代模型生成的合成数据混合作为训练数据,其中,真实数据的占比根据训练代数增加而动态降低;利用混合数据训练语言模型,更新模型参数,生成下一代训练所需的合成数据;在每一代训练后,度量当前模型生成的数据分布与真实数据分布的差异,并根据差异动态调整真实数据的占比;通过上述步骤持续优化语言模型的自回归训练过程。有效抑制了语言模型在多轮自回归训练过程中产生的分布漂移问题。
技术关键词
语言模型优化方法 数据分布 构建语言模型 更新模型参数 训练语言模型 度量 计算机程序指令 动态 偏差 策略 计算机程序产品 处理器 电子设备 规模 样本 框架 可读存储介质 序列
系统为您推荐了相关专利信息
1
一种基于大语言模型和强化学习的文本去毒方法
去毒方法 大语言模型 微调机制 平行语料数据 策略优化方法
2
基于多元组数据优化的大规模数据挖掘方法
大规模数据挖掘 多元组 数据分布 关联规则挖掘算法 动态特征选择
3
一种面向量测数据的数据质量检测方法及系统
综合统计特征 推荐算法 评分算法 高阶奇异值分解 预测误差
4
一种用于边缘智能的联邦类增量学习系统及方法
分类器 神经网络模型 智能设备 云服务器 特征提取器
5
一种基于深度学习的金属材料设计方法
金属材料 注意力机制 计算误差 传播算法 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号