摘要
本发明公开一种基于稀疏矩阵的轻量化持续微调方法,属于计算机视觉技术领域。本发明使用稀疏矩阵和矩阵分解技术,对微调所需的稀疏矩阵进行低秩分解,构造共享权重矩阵和持续学习专业权重矩阵,进而完成对多个下游数据集的微调训练。本发明能够提高各种通用的大模型在下游数据集上的性能,且具有通用性,不依赖与特定的网络架构,适用于当前所有的视觉、语言和多模态大模型,方法简单方便,能够在保留大模型泛化和通用能力的基础上,有效提高在下游数据上的精度。
技术关键词
微调方法
矩阵低秩分解
矩阵分解技术
计算机视觉技术
数据
专业
传播算法
网络架构
超参数
系列
编码
精度
基础
系统为您推荐了相关专利信息
量化评估系统
危险性
多模态
深度神经网络模型
深度学习预测模型
监测诊断系统
膀胱出口梗阻
尿道
形态
动态图像处理技术
智能化建筑
卷积神经网络模型
原始图像数据
深度学习模型
图像采集模块
凭证
人工智能AI模块
智能客服系统
计算机可执行指令
图像