语言模型训练方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510408849

申请日期：2025-04-02

公开号：CN120471127A

公开日期：2025-08-12

类型：发明专利

摘要

本公开提供一种语言模型训练方法、装置、电子设备及存储介质。所述方法包括：对初始语言模型进行训练得到权重矩阵，对权重矩阵进行分解处理得到基础特征矩阵和初始任务适配矩阵；对初始任务适配矩阵进行更新处理得到更新任务适配矩阵；确定在当前训练周期的更新任务适配矩阵中每个奇异向量方向的当前敏感度；根据当前敏感度从多个奇异向量方向中确定敏感方向，对敏感方向关联的缩放系数进行正则化处理得到正则化损失函数；响应于确定在连续的预设数量训练周期内奇异向量方向的变化敏感度处于衰减状态，对缩放系数进行参数重置得到更新缩放系数；将基础特征矩阵和更新任务适配矩阵进行合并处理，并将更新语言模型作为目标语言模型。

技术关键词

矩阵语言模型训练方法周期元素均匀噪声文本样本模型训练装置基础电子设备数据随机噪声传播算法模块参数计算机处理器存储器指令

系统为您推荐了相关专利信息

一种融入系统状态估计的船舶运动智能预报方法及系统

智能预报方法系统状态估计船舶运动预报船舶运动系统滑动窗口

一种基于深度卡尔曼滤波的新能源电网状态估计方法

系统运行状态状态估计方法新能源电网长短期记忆神经网络卡尔曼滤波

声纹识别辅助的智能穿戴设备健康监测方法及系统

健康监测方法风险评估模型智能穿戴设备医疗云平台声纹特征

一种基于改进遗传算法船厂邮轮分段堆场调度优化方法

分段调度优化方法遗传算法深度优先搜索邮轮

一种楼宇空间的温度控制方法

温度控制方法实时数据策略温度调节器规模

语言模型训练方法、装置、电子设备及存储介质

站点导航

APP 下载