一种抑制大模型垂域微调过拟合的方法、装置及存储介质

AITNT
正文
推荐专利
一种抑制大模型垂域微调过拟合的方法、装置及存储介质
申请号:CN202510155047
申请日期:2025-02-12
公开号:CN120258085A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种抑制大模型垂域微调过拟合的方法、装置及存储介质,属于大模型微调与深度学习优化技术领域。本发明为解决在使用LoRA进行参数高效微调时可能面临的过拟合问题,主要采用引入随机掩码的低秩矩阵分解技术,并结合多次掩码采样进行模型集成。通过这种方法,能够在下游任务中,即使在数据量较少的情况下,有效提升模型的泛化能力,防止过拟合,同时保持模型的表达能力。与传统方法相比,本发明具有实现简单、高效且具有良好的泛化性能。
技术关键词
参数 矩阵分解技术 深度学习优化 大语言模型 可读存储介质 存储器 处理器 样本 表达式 计算机 线性 阶段 数据
系统为您推荐了相关专利信息
1
视觉信息融合方法、装置、设备、介质及计算机程序产品
信息融合方法 融合视觉 序列 标记 文本
2
剩余总线仿真校验方法及系统、电子设备
仿真校验方法 校验算法 车载网络 信号 可读存储介质
3
机器人任务流程管理方法、装置、计算机设备及存储介质
机器人 管理方法 节点 变量 逻辑
4
一种卫星测控交互式仿真与发射管理一体化方法及系统
仿真平台 评价特征 地面站 数字孪生模型 仿真模型
5
一种参数确定方法及装置、电子设备、芯片及介质
处理单元 信号处理装置 频率响应 音频信号处理技术 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号