摘要
本发明公开了一种基于低秩分解和奇异值分解的协同参数微调方法、介质及设备。该方法通过引入一种灵活的架构,解决了传统LoRA方法在多任务学习和有限样本条件下的适应性问题。备份那么通过设计三种协同策略(完全协同、随机协同和启发式协同),在不同计算消耗下优化了LoRA方法中的矩阵A和B的协作,避免了固定结构设计带来的性能瓶颈,从而提高了模型在多任务学习中的性能。此外,为了加速收敛并提高性能,本发明将高效的奇异值分解初始化方案扩展到架构中。与传统方法相比,本发明的自适应协同策略在计算效率和任务适应性方面具有显著优势,能够有效应对大规模任务和稀缺数据的挑战,具有优化效果好、泛化性能强等优点。
技术关键词
矩阵
微调方法
协作策略
计算机电子设备
大语言模型
参数
计算方法
文本
平方根
多任务
存储计算机程序
计算机程序产品
处理器
自然语言
数据
可读存储介质
存储器
指令
系统为您推荐了相关专利信息
大语言模型
生成方法
特征提取模块
规划
生成装置
门控循环单元
滑坡涌浪高度
GRU模型
预测系统
网络模型训练
停车库系统
停取车系统
智能停车库
节点
车库结构
电网优化控制方法
气象预警信息
节点特征
规划
数据