模型训练方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
模型训练方法、装置、设备、存储介质及程序产品
申请号:CN202511006917
申请日期:2025-07-21
公开号:CN120509453B
公开日期:2025-11-04
类型:发明专利
摘要
本申请公开了一种模型训练方法、装置、设备、存储介质及程序产品,方法包括:在前向过程中,基于线性层对应的缩放参数对第二数据类型的输入张量进行类型转换,得到第一数据类型的输入张量;在线性层完成计算后,将第一数据类型的输出张量转换为第二数据类型的输出张量;在反向过程中,基于线性层对应的缩放参数对第一数据类型的模型参数进行类型转换,得到第二数据类型的模型参数;基于第二数据类型的模型参数和第二数据类型的损失值确定第二数据类型的梯度;利用第二数据类型的梯度对模型的模型参数进行更新,得到训练后的模型。如此,可以在保证模型精度的情况下,提升模型训练效率,降低了模型训练时对算力、存储的要求。
技术关键词
模型训练方法 缩放参数 线性 图像处理模型 模型训练装置 精度 浮点数 处理器 计算机程序产品 计算机设备 可读存储介质 存储器 样本 模块 指令
系统为您推荐了相关专利信息
1
一种训练方法、装置、存算系统和电子设备
人工智能模型 线性 数据 噪声模型 电子设备
2
一种基于Transformer-LSTM的晶圆沉积膜厚预测方法
注意力机制 流量控制器 加热器 序列 子系统
3
基于模型的数据处理方法和装置、设备、介质及产品
需求预测模型 资产 因子 时间序列预测模型 数据处理方法
4
显示面板抓取臂、显示面板抓取机器人及显示面板生产线
抓取机器人 线性运动机构 旋转臂 异物收集器 面板生产线
5
基于迁移学习的心力衰竭风险预测模型构建方法
心力衰竭模型 心力衰竭风险 预测模型构建方法 预训练模型 迁移学习技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号