摘要
本公开提供了模型训练方法、装置、设备及存储介质,涉及计算机技术领域,尤其涉及神经网络模型、模型训练技术领域。具体实现方案为:由计算单元对存储于存储器中的目标模型的激活张量和权重张量,执行基于哈达玛预变换的量化矩阵乘法,以基于数据位宽更小的低精度张量生成线性层的输出张量;利用输出张量和所述目标模型的后续网络层完成前向传播,以得到损失值;根据损失值,通过反向传播算法更新存储于存储器中的目标模型的模型参数。利用本公开的技术方案,能够在保证模型训练精度的前提下,显著降低计算过程中的存储器资源占用和计算量,降低了训练成本。
技术关键词
传播算法
模型训练方法
精度
因子
矩阵
格式
存储器
数值
模型训练技术
优化器
模型训练装置
分布式训练
参数
线性
神经网络模型
计算机程序产品
处理器通信
信息更新
系统为您推荐了相关专利信息
亲和力
LSTM模型
深度学习技术
序列
跨越血脑屏障