摘要
本申请涉及人工智能技术领域,提供一种非对称低秩微调模型训练方法、装置、设备、介质及产品。方法包括:构建多任务数据集;多任务数据集包括多个任务分类数据集,每一任务分类数据集包括多个连续模态的样本数据;基于多任务数据集,对初始模型进行预训练,获得非对称低秩微调模型;非对称低秩微调模型包括非对称低秩适配器,非对称低秩适配器是基于一个第一矩阵和多个第二矩阵进行微调的,第二矩阵的数量是基于每一样本数据的统计向量确定的。通过上述方式,解决了模型所需使用的第二矩阵的数量难以确定的问题,并将采用非对称低秩适配器架构的模型应用到连续模态的多任务分类场景中,扩大了非对称低秩适配器架构的应用场景。
技术关键词
模型训练方法
数据
样本
适配器架构
矩阵
学生
非暂态计算机可读存储介质
教师
多任务分类
模型训练装置
处理器
指数
人工智能技术
计算机程序产品
蒸馏
存储器
策略
场景
系统为您推荐了相关专利信息
水工混凝土结构
态监测方法
声发射传感器
构建分类模型
灰狼优化算法
彩涂生产线
中央控制模块
减排系统
在线监测模块
远程监控模块
隧道
数据管理方法
BIM技术
车道
风险评估模型
光伏电站运维
自主移动机器人
管理方法
条件生成对抗网络
三维卷积神经网络