非对称低秩微调模型训练方法、装置、设备、介质及产品

AITNT
正文
推荐专利
非对称低秩微调模型训练方法、装置、设备、介质及产品
申请号:CN202510624548
申请日期:2025-05-15
公开号:CN120671765A
公开日期:2025-09-19
类型:发明专利
摘要
本申请涉及人工智能技术领域,提供一种非对称低秩微调模型训练方法、装置、设备、介质及产品。方法包括:构建多任务数据集;多任务数据集包括多个任务分类数据集,每一任务分类数据集包括多个连续模态的样本数据;基于多任务数据集,对初始模型进行预训练,获得非对称低秩微调模型;非对称低秩微调模型包括非对称低秩适配器,非对称低秩适配器是基于一个第一矩阵和多个第二矩阵进行微调的,第二矩阵的数量是基于每一样本数据的统计向量确定的。通过上述方式,解决了模型所需使用的第二矩阵的数量难以确定的问题,并将采用非对称低秩适配器架构的模型应用到连续模态的多任务分类场景中,扩大了非对称低秩适配器架构的应用场景。
技术关键词
模型训练方法 数据 样本 适配器架构 矩阵 学生 非暂态计算机可读存储介质 教师 多任务分类 模型训练装置 处理器 指数 人工智能技术 计算机程序产品 蒸馏 存储器 策略 场景
系统为您推荐了相关专利信息
1
基于声发射和深度学习的水工混凝土结构性态监测方法及系统
水工混凝土结构 态监测方法 声发射传感器 构建分类模型 灰狼优化算法
2
一种彩涂生产线的VOC减排系统及方法
彩涂生产线 中央控制模块 减排系统 在线监测模块 远程监控模块
3
大模型的微调方法及装置、电子设备、介质、产品
矩阵 元素 数据处理模型 参数 微调方法
4
一种基于BIM技术的公路施工安全数据管理方法与系统
隧道 数据管理方法 BIM技术 车道 风险评估模型
5
一种智能化光伏电站运维管理方法及系统
光伏电站运维 自主移动机器人 管理方法 条件生成对抗网络 三维卷积神经网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号