面向预训练语言模型的密态微调和推理方法、设备及产品

正文

推荐专利

申请号：CN202411548635

申请日期：2024-11-01

公开号：CN119692396B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种面向预训练语言模型的密态微调和推理方法、设备及产品，参与主体包括用户和服务提供商；所述服务提供商，拥有预训练语言模型并且参与密态微调和密态推理，该预训练语言模型的参数是服务提供商的隐私；所述用户，拥有微调数据集和推理的输入、输出，是隐私数据；所述密态微调，在保护服务提供商的预训练语言模型和用户的微调数据集的前提下，对语言模型进行微调，用户得到微调模型的非冻结部分；所述密态推理，在保护用户推理输入和输出的前提下，由服务提供商进行微调模型冻结层的推理，得到的推理结果被交付给用户，用户进行非冻结层的推理并获得推理结果。本发明减少了密态微调和推理的时间和通信开销，并且提升了准确率。

技术关键词

预训练语言模型推理方法协议矩阵多项式计算机程序指令阶段非线性查找表优化器参数编码离线线性单元生成随机注意力机制模块在线

系统为您推荐了相关专利信息

一种基于三维忆阻型均衡器的高速链路信号均衡方法

信号均衡方法矩阵忆阻器交叉阵列链路高速信号完整性

一种基于系统阻抗映射机理的V2G充电桩的控制方法及系统

电网谐波电流方程电压坐标系神经网络预测控制方法

一种双机械臂基坐标系标定及同轴定位方法

同轴定位坐标系标定装置矩阵双机械臂

基于连续隐马尔可夫模型的电机绝缘的击穿电压预测方法

连续隐马尔可夫模型电压预测方法高斯概率密度函数 Viterbi算法转移概率矩阵

一种基于改进的遗传-蚁群算法的路径规划方法

蚁群算法路径规划方法蚂蚁遗传算法矩阵

面向预训练语言模型的密态微调和推理方法、设备及产品

站点导航

APP 下载