摘要
本发明公开了一种抑制大模型垂域微调过拟合的方法、装置及存储介质,属于大模型微调与深度学习优化技术领域。本发明为解决在使用LoRA进行参数高效微调时可能面临的过拟合问题,主要采用引入随机掩码的低秩矩阵分解技术,并结合多次掩码采样进行模型集成。通过这种方法,能够在下游任务中,即使在数据量较少的情况下,有效提升模型的泛化能力,防止过拟合,同时保持模型的表达能力。与传统方法相比,本发明具有实现简单、高效且具有良好的泛化性能。
技术关键词
参数
矩阵分解技术
深度学习优化
大语言模型
可读存储介质
存储器
处理器
样本
表达式
计算机
线性
阶段
数据
系统为您推荐了相关专利信息
仿真校验方法
校验算法
车载网络
信号
可读存储介质
仿真平台
评价特征
地面站
数字孪生模型
仿真模型
处理单元
信号处理装置
频率响应
音频信号处理技术
数据