摘要
本发明公开一种基于模块融合的大模型能力扩展方法及系统,属于人工智能技术领域。本发明通过引入LoRA模块和融合模块,优化了大规模预训练模型在引入新任务时的能力扩展,保持了较高的微调和推理效率;通过任务数据的抽样重放,有效缓解了不同任务数据质量差异带来的问题,降低了适应新任务的难度。此外,由于本发明设计的模型结构不含有非线性层,因此多个LoRA的合并等效于参数矩阵的乘积运算,该过程可以在不增加大量计算开销的情况下完成能力扩展。
技术关键词
模块
参数
计算机程序指令
数据
计算机程序产品
计算机设备
可读存储介质
预训练模型
扩展系统
人工智能技术
电子设备
处理器
非线性
存储器
矩阵
系统为您推荐了相关专利信息
肿瘤杀伤效应
肿瘤微环境
直肠癌
液体活检技术
表达肿瘤抗原
热传导方程
智能分析方法
节点特征
矩阵
径向基函数插值方法
数据分类模型
训练集
设备可读存储介质
时间段
模块
机电设备
协议
物联网关
数据处理方法
数据依赖关系