语言模型训练方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
语言模型训练方法、装置、电子设备及存储介质
申请号:CN202510408849
申请日期:2025-04-02
公开号:CN120471127A
公开日期:2025-08-12
类型:发明专利
摘要
本公开提供一种语言模型训练方法、装置、电子设备及存储介质。所述方法包括:对初始语言模型进行训练得到权重矩阵,对权重矩阵进行分解处理得到基础特征矩阵和初始任务适配矩阵;对初始任务适配矩阵进行更新处理得到更新任务适配矩阵;确定在当前训练周期的更新任务适配矩阵中每个奇异向量方向的当前敏感度;根据当前敏感度从多个奇异向量方向中确定敏感方向,对敏感方向关联的缩放系数进行正则化处理得到正则化损失函数;响应于确定在连续的预设数量训练周期内奇异向量方向的变化敏感度处于衰减状态,对缩放系数进行参数重置得到更新缩放系数;将基础特征矩阵和更新任务适配矩阵进行合并处理,并将更新语言模型作为目标语言模型。
技术关键词
矩阵 语言模型训练方法 周期 元素 均匀噪声 文本 样本 模型训练装置 基础 电子设备 数据 随机噪声 传播算法 模块 参数 计算机 处理器 存储器 指令
系统为您推荐了相关专利信息
1
一种融入系统状态估计的船舶运动智能预报方法及系统
智能预报方法 系统状态估计 船舶运动预报 船舶运动系统 滑动窗口
2
一种基于深度卡尔曼滤波的新能源电网状态估计方法
系统运行状态 状态估计方法 新能源电网 长短期记忆神经网络 卡尔曼滤波
3
声纹识别辅助的智能穿戴设备健康监测方法及系统
健康监测方法 风险评估模型 智能穿戴设备 医疗云平台 声纹特征
4
一种基于改进遗传算法船厂邮轮分段堆场调度优化方法
分段 调度优化方法 遗传算法 深度优先搜索 邮轮
5
一种楼宇空间的温度控制方法
温度控制方法 实时数据 策略 温度调节器 规模
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号