一种抑制大模型垂域微调过拟合的方法、装置及存储介质

正文

推荐专利

申请号：CN202510155047

申请日期：2025-02-12

公开号：CN120258085A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种抑制大模型垂域微调过拟合的方法、装置及存储介质，属于大模型微调与深度学习优化技术领域。本发明为解决在使用LoRA进行参数高效微调时可能面临的过拟合问题，主要采用引入随机掩码的低秩矩阵分解技术，并结合多次掩码采样进行模型集成。通过这种方法，能够在下游任务中，即使在数据量较少的情况下，有效提升模型的泛化能力，防止过拟合，同时保持模型的表达能力。与传统方法相比，本发明具有实现简单、高效且具有良好的泛化性能。

技术关键词

参数矩阵分解技术深度学习优化大语言模型可读存储介质存储器处理器样本表达式计算机线性阶段数据

系统为您推荐了相关专利信息

视觉信息融合方法、装置、设备、介质及计算机程序产品

信息融合方法融合视觉序列标记文本

剩余总线仿真校验方法及系统、电子设备

仿真校验方法校验算法车载网络信号可读存储介质

机器人任务流程管理方法、装置、计算机设备及存储介质

机器人管理方法节点变量逻辑

一种卫星测控交互式仿真与发射管理一体化方法及系统

仿真平台评价特征地面站数字孪生模型仿真模型

一种参数确定方法及装置、电子设备、芯片及介质

处理单元信号处理装置频率响应音频信号处理技术数据

一种抑制大模型垂域微调过拟合的方法、装置及存储介质

站点导航

APP 下载