模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品

AITNT
正文
推荐专利
模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品
申请号:CN202511079694
申请日期:2025-08-01
公开号:CN120975133A
公开日期:2025-11-18
类型:发明专利
摘要
本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取第一语言模型的第一参数矩阵;针对第一参数矩阵,基于第一参数矩阵中每个第一参数值与第一参数矩阵的矩阵均值之间的第一差值,确定第一参数矩阵中每个第一参数值的第一更新程度参数;基于第一训练样本,确定第一语言模型的第一损失,并基于第一损失确定每个第一参数值的梯度;基于每个第一参数值的梯度、以及每个第一参数值的第一更新程度参数,对第一语言模型的至少一个第一参数矩阵中每个第一参数值进行更新,得到第二语言模型。通过本申请,能够对模型参数的训练程度进行区别性处理,从而不仅可以优化训练效果,还可以保留模型的初始性能。
技术关键词
文本 样本 模型训练方法 矩阵 字符 参数 计算机可执行指令 计算机程序产品 模型训练装置 数据 可读存储介质 电子设备 模块 处理器 存储器 关系
系统为您推荐了相关专利信息
1
一种基于物联网的通信方法
通信方法 偏差 指数 数据 序列
2
一种数字展厅系统及其访客引导方法
数字展厅 前端组件 意图识别模型 导览系统 接入网关
3
聚类模型的训练方法及设备、存储介质
样本 原型 拉普拉斯 矩阵 机器学习技术
4
一种基于髁轴的排牙分步模拟系统、介质及方法
下颌牙齿模型 模拟系统 存储程序模块 矩阵 运动
5
密码设备电磁侧信息密钥恢复方法、系统、设备及介质
密钥恢复方法 密码设备 电磁 残差神经网络 非线性特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号