基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置

AITNT
正文
推荐专利
基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置
申请号:CN202411015559
申请日期:2024-07-26
公开号:CN119204142A
公开日期:2024-12-27
类型:发明专利
摘要
本申请涉及计算机技术领域,特别是涉及一种基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置。一个实施例的基于低秩张量适应的模型微调训练方法包括:获取预训练模型;为所述预训练模型的模型参数添加微调参数,获得多个微调参数矩阵,并将所述多个微调参矩阵合并为一个微调参数张量并分解为一个核心张量与两个低秩因子矩阵;冻结两个所述低秩因子矩阵以及所述模型参数,获得待训练模型;通过样本数据对所述待训练模型进行微调训练,在训练过程中对所述核心张量进行调整,获得训练后的目标模型。采用本申请实施例能够减少了在针对预训练模型进行模型微调时需要调整的参数的数量,减少了参数微调的成本。
技术关键词
预训练模型 矩阵 参数 因子 核心 样本 数据获取模块 训练装置 处理器 计算机设备 可读存储介质 存储器 标签
系统为您推荐了相关专利信息
1
基于全聚焦算法的超声检测成像方法和装置
主成分分析技术 矩阵 检测成像方法 聚焦算法 数据
2
一种基于时序大模型的电厂设备故障预测方法
贝叶斯神经网络 故障预测方法 电厂设备 预测残差 设备运行状态
3
集成电路芯片的展示方法、装置、存储介质及电子设备
堆叠结构 可视化界面 集成电路芯片 展示方法 集成电路版图
4
输电线路工程的水保数智化设计方法
输电线路工程 数字高程模型 挡土墙 排水沟 措施
5
基于量子密钥分发的通信协议安全验证方法
验证方法 生成安全策略 协议 仿真数据 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号