摘要
本申请公开了一种预训练语言模型的部署方法、电子设备和可读存储介质,涉及预训练语言模型技术领域。方法包括:确定待量化的初始预训练语言模型的初始权重矩阵和海森矩阵;初始权重矩阵用于表征初始预训练语言模型的模型信息拓扑,海森矩阵用于表征初始权重矩阵中的敏感权重;基于子采样随机哈达玛变换算法生成稀疏变换矩阵;通过稀疏变换矩阵对初始权重矩阵进行非相干处理,得到处理后的优化权重矩阵;基于优化权重矩阵和海森矩阵执行自适应舍入操作,得到量化后的量化权重矩阵;根据量化权重矩阵确定量化后的目标语言模型,并发送至待部署设备。本申请解决了部署预训练语言模型的效率低的问题,达到提高部署预训练语言模型的效率的技术效果。
技术关键词
预训练语言模型
矩阵
变换算法
电子设备
可读存储介质
存储计算机程序
计算机程序产品
框架
处理器
变换器
数据
元素
接口
校准
存储器
序列
系统为您推荐了相关专利信息
协方差矩阵
路面
卡尔曼滤波
支持向量机模型
车辆模型
数字孪生模型
动态优化方法
质子束流强度
仿真数据
物理
图像聚类方法
样本
计算机可执行指令
超像素分割技术
图像分割