摘要
本发明公开了一种面向预训练语言模型的密态微调和推理方法、设备及产品,参与主体包括用户和服务提供商;所述服务提供商,拥有预训练语言模型并且参与密态微调和密态推理,该预训练语言模型的参数是服务提供商的隐私;所述用户,拥有微调数据集和推理的输入、输出,是隐私数据;所述密态微调,在保护服务提供商的预训练语言模型和用户的微调数据集的前提下,对语言模型进行微调,用户得到微调模型的非冻结部分;所述密态推理,在保护用户推理输入和输出的前提下,由服务提供商进行微调模型冻结层的推理,得到的推理结果被交付给用户,用户进行非冻结层的推理并获得推理结果。本发明减少了密态微调和推理的时间和通信开销,并且提升了准确率。
技术关键词
预训练语言模型
推理方法
协议
矩阵
多项式
计算机程序指令
阶段
非线性
查找表
优化器
参数
编码
离线
线性单元
生成随机
注意力机制
模块
在线
系统为您推荐了相关专利信息
信号均衡方法
矩阵
忆阻器交叉阵列
链路
高速信号完整性
电网谐波电流
方程
电压
坐标系
神经网络预测控制方法
连续隐马尔可夫模型
电压预测方法
高斯概率密度函数
Viterbi算法
转移概率矩阵