基于动态低秩张量适应的模型微调训练方法、模型应用方法及相关装置

AITNT
正文
推荐专利
基于动态低秩张量适应的模型微调训练方法、模型应用方法及相关装置
申请号:CN202411015046
申请日期:2024-07-26
公开号:CN119204141A
公开日期:2024-12-27
类型:发明专利
摘要
本申请涉及计算机技术领域,特别是涉及一种基于动态低秩张量适应的模型微调训练方法、模型应用方法及相关装置。一个实施例的基于动态低秩张量适应的模型微调训练方法包括:获取预训练模型;为预训练模型的模型参数添加微调参数获得不同层的微调参数矩阵,将多个层的微调参数矩阵合并为一个微调参数张量并分解为一个核心张量与两个低秩因子矩阵,获得待微调参数;通过样本数据对预训练模型进行微调,在微调过程中冻结预训练模型的原始参数,按顺序对核心张量与两个低秩因子矩阵进行更新,并对更新后的核心张量的切片矩阵进行低秩调整,获得更新后的微调参数。采用本实施例的方案,可以在减少参数微调成本的同时还可以进一步提高得到的模型的性能。
技术关键词
预训练模型 矩阵 参数 核心 因子 切片 动态 数据获取模块 训练装置 样本 计算机设备 存储器 处理器 元素
系统为您推荐了相关专利信息
1
一种相位校正方法及系统
相位校正方法 序列 语义特征提取 协方差矩阵 相位校正器
2
一种大型PCB直流仿真方法及相关设备
PCB设计文件 仿真方法 网络 简化仿真模型 元器件
3
一种基于身份加密的代理配对方法及系统
发送者 配对方法 身份 消息加密 私钥
4
一种基于机器人力位混控的磨抛轨迹自适应调整方法
力控装置 校准 轨迹 磨抛工件 理论
5
一种水厂过程控制实时监测系统
控制实时监测系统 智能数据分析技术 设备运行数据 多参数传感器 监控中心
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号