模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品

正文

推荐专利

申请号：CN202511079694

申请日期：2025-08-01

公开号：CN120975133A

公开日期：2025-11-18

类型：发明专利

摘要

本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：获取第一语言模型的第一参数矩阵；针对第一参数矩阵，基于第一参数矩阵中每个第一参数值与第一参数矩阵的矩阵均值之间的第一差值，确定第一参数矩阵中每个第一参数值的第一更新程度参数；基于第一训练样本，确定第一语言模型的第一损失，并基于第一损失确定每个第一参数值的梯度；基于每个第一参数值的梯度、以及每个第一参数值的第一更新程度参数，对第一语言模型的至少一个第一参数矩阵中每个第一参数值进行更新，得到第二语言模型。通过本申请，能够对模型参数的训练程度进行区别性处理，从而不仅可以优化训练效果，还可以保留模型的初始性能。

技术关键词

文本样本模型训练方法矩阵字符参数计算机可执行指令计算机程序产品模型训练装置数据可读存储介质电子设备模块处理器存储器关系

系统为您推荐了相关专利信息

一种基于物联网的通信方法

通信方法偏差指数数据序列

一种数字展厅系统及其访客引导方法

数字展厅前端组件意图识别模型导览系统接入网关

聚类模型的训练方法及设备、存储介质

样本原型拉普拉斯矩阵机器学习技术

一种基于髁轴的排牙分步模拟系统、介质及方法

下颌牙齿模型模拟系统存储程序模块矩阵运动

密码设备电磁侧信息密钥恢复方法、系统、设备及介质

密钥恢复方法密码设备电磁残差神经网络非线性特征

模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品

站点导航

APP 下载