一种基于自回归训练的语言模型优化方法及相关设备

正文

推荐专利

申请号：CN202510741088

申请日期：2025-06-05

公开号：CN120258047B

公开日期：2025-08-26

类型：发明专利

摘要

本申请提供一种基于自回归训练的语言模型优化方法及相关设备，方法包括：构建语言模型的自回归训练框架，基于输入的历史上下文预测后续词的概率分布，其中每一代自回归训练中的概率分布用于生成下一代的合成数据；在每一代训练中，按设定比例将真实数据与上一代模型生成的合成数据混合作为训练数据，其中，真实数据的占比根据训练代数增加而动态降低；利用混合数据训练语言模型，更新模型参数，生成下一代训练所需的合成数据；在每一代训练后，度量当前模型生成的数据分布与真实数据分布的差异，并根据差异动态调整真实数据的占比；通过上述步骤持续优化语言模型的自回归训练过程。有效抑制了语言模型在多轮自回归训练过程中产生的分布漂移问题。

技术关键词

语言模型优化方法数据分布构建语言模型更新模型参数训练语言模型度量计算机程序指令动态偏差策略计算机程序产品处理器电子设备规模样本框架可读存储介质序列

系统为您推荐了相关专利信息

一种基于大语言模型和强化学习的文本去毒方法

去毒方法大语言模型微调机制平行语料数据策略优化方法

基于多元组数据优化的大规模数据挖掘方法

大规模数据挖掘多元组数据分布关联规则挖掘算法动态特征选择

一种面向量测数据的数据质量检测方法及系统

综合统计特征推荐算法评分算法高阶奇异值分解预测误差

一种用于边缘智能的联邦类增量学习系统及方法

分类器神经网络模型智能设备云服务器特征提取器

一种基于深度学习的金属材料设计方法

金属材料注意力机制计算误差传播算法元素

一种基于自回归训练的语言模型优化方法及相关设备

站点导航

APP 下载