一种广义逼近的自适应LoRA低秩方法

正文

推荐专利

一种广义逼近的自适应LoRA低秩方法

申请号：CN202510090158

申请日期：2025-01-21

公开号：CN119940415A

公开日期：2025-05-06

类型：发明专利

摘要

本发明提出了一种广义逼近的自适应LoRA低秩方法，特征在于包括直接对transformer注意力层的多个参数变化量矩阵进行广义低秩逼近求解，交替迭代计算求解获得参数变化量矩阵的左右投影变换矩阵，根据优化目标的收敛条件以双边降维的迭代方法对矩阵进行降秩，最终求得每个参数变化量矩阵的低秩结构。本发明基于大语言模型领域专业训练过程中所用到的LoRA高效微调的理念逻辑，采用矩阵的广义低秩逼近方法求解参数变化量的低秩结构，相较于传统的LoRA高效微调来说能自动计算不同矩阵的低秩结构，并且相较于基于SVD分解的AdaLoRA方法能不依靠在大语言模型训练的损失函数里添加复杂的惩罚项来实现不同矩阵的低秩结构计算。该方法具有更好的灵活性、计算量小、鲁棒性强的优点。

技术关键词

投影变换矩阵广义低秩结构梯度下降法大语言模型迭代方法特征值注意力参数鲁棒性逻辑

系统为您推荐了相关专利信息

一种机器人的惯性定位方法及系统

机器人足部惯性定位方法导航误差导航坐标系导航系统

一种基于改进图卷积网络的电力变压器故障诊断方法

电力变压器故障卷积网络模型归一化方法电力设备故障诊断技术网络结构

一种基于大模型的人机交互安全性监管方法及装置

文本监管方法计算机可读取存储介质计算机可读指令监管设备

一种用于大语言模型端侧部署的迭代式量化感知训练方法

大语言模型掩码矩阵阶段参数文本

一种基于LLM的多模型调度架构方法

多模态文本语音大数据处理技术 NLP技术

一种广义逼近的自适应LoRA低秩方法

站点导航

APP 下载