模型训练方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202511006917

申请日期：2025-07-21

公开号：CN120509453B

公开日期：2025-11-04

类型：发明专利

摘要

本申请公开了一种模型训练方法、装置、设备、存储介质及程序产品，方法包括：在前向过程中，基于线性层对应的缩放参数对第二数据类型的输入张量进行类型转换，得到第一数据类型的输入张量；在线性层完成计算后，将第一数据类型的输出张量转换为第二数据类型的输出张量；在反向过程中，基于线性层对应的缩放参数对第一数据类型的模型参数进行类型转换，得到第二数据类型的模型参数；基于第二数据类型的模型参数和第二数据类型的损失值确定第二数据类型的梯度；利用第二数据类型的梯度对模型的模型参数进行更新，得到训练后的模型。如此，可以在保证模型精度的情况下，提升模型训练效率，降低了模型训练时对算力、存储的要求。

技术关键词

模型训练方法缩放参数线性图像处理模型模型训练装置精度浮点数处理器计算机程序产品计算机设备可读存储介质存储器样本模块指令

系统为您推荐了相关专利信息

一种训练方法、装置、存算系统和电子设备

人工智能模型线性数据噪声模型电子设备

一种基于Transformer-LSTM的晶圆沉积膜厚预测方法

注意力机制流量控制器加热器序列子系统

基于模型的数据处理方法和装置、设备、介质及产品

需求预测模型资产因子时间序列预测模型数据处理方法

显示面板抓取臂、显示面板抓取机器人及显示面板生产线

抓取机器人线性运动机构旋转臂异物收集器面板生产线

基于迁移学习的心力衰竭风险预测模型构建方法

心力衰竭模型心力衰竭风险预测模型构建方法预训练模型迁移学习技术

模型训练方法、装置、设备、存储介质及程序产品

站点导航

APP 下载