预训练模型的参数微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202411904379

申请日期：2024-12-23

公开号：CN119849576B

公开日期：2025-10-31

类型：发明专利

摘要

公开了一种预训练模型的参数微调方法、装置、设备及介质。参数微调方法基于文本数据集对用于自然语言处理的预训练模型进行参数微调，预训练模型包括具有初始权重矩阵的线性层，所述参数微调方法包括：对线性层施加基于至少一个旋转矩阵的正交变换并根据正交变换获得角度参数矩阵，基于初始权重矩阵和角度参数矩阵来构建正交微调层，将预训练模型中的线性层替换为正交微调层以获得待微调模型；基于文本数据集通过梯度反向传播算法仅更新角度参数矩阵以实现对待微调模型的训练；以及将经训练的待微调模型作为参数微调的结果进行输出。

技术关键词

微调方法预训练模型矩阵参数正交变换线性微调装置传播算法自然语言文本多层感知机数据处理器输出模块可读存储介质注意力存储器计算机

系统为您推荐了相关专利信息

一种输电通道森林地上生物量扰动分析方法及系统

森林地上生物量扰动分析方法光斑反演模型数据

纳米颗粒光学性质的确定方法

纳米颗粒三维模型电磁仿真三维重构算法滤波反投影算法

基于联邦学习的保护隐私且鲁棒的个性化图像识别方法

图像识别方法中心服务器标签类别保护用户隐私随机梯度下降

基于图像分析的SMT缺陷诊断与改进方法及系统

特征提取模型分类器模型周期位置更新解码参数

一种通信系统中的密钥生成方法及系统

密钥生成方法通信系统信道估计值特征值信道算法

预训练模型的参数微调方法、装置、设备及介质

站点导航

APP 下载