摘要
公开了一种预训练模型的参数微调方法、装置、设备及介质。参数微调方法基于文本数据集对用于自然语言处理的预训练模型进行参数微调,预训练模型包括具有初始权重矩阵的线性层,所述参数微调方法包括:对线性层施加基于至少一个旋转矩阵的正交变换并根据正交变换获得角度参数矩阵,基于初始权重矩阵和角度参数矩阵来构建正交微调层,将预训练模型中的线性层替换为正交微调层以获得待微调模型;基于文本数据集通过梯度反向传播算法仅更新角度参数矩阵以实现对待微调模型的训练;以及将经训练的待微调模型作为参数微调的结果进行输出。
技术关键词
微调方法
预训练模型
矩阵
参数
正交变换
线性
微调装置
传播算法
自然语言
文本
多层感知机
数据
处理器
输出模块
可读存储介质
注意力
存储器
计算机
系统为您推荐了相关专利信息
森林地上生物量
扰动分析方法
光斑
反演模型
数据
纳米颗粒
三维模型
电磁仿真
三维重构算法
滤波反投影算法
图像识别方法
中心服务器
标签类别
保护用户隐私
随机梯度下降
特征提取模型
分类器模型
周期
位置更新
解码参数
密钥生成方法
通信系统
信道估计值
特征值
信道算法