基于模块融合的大模型能力扩展方法及系统

正文

推荐专利

基于模块融合的大模型能力扩展方法及系统

申请号：CN202510016701

申请日期：2025-01-06

公开号：CN120069059A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开一种基于模块融合的大模型能力扩展方法及系统，属于人工智能技术领域。本发明通过引入LoRA模块和融合模块，优化了大规模预训练模型在引入新任务时的能力扩展，保持了较高的微调和推理效率；通过任务数据的抽样重放，有效缓解了不同任务数据质量差异带来的问题，降低了适应新任务的难度。此外，由于本发明设计的模型结构不含有非线性层，因此多个LoRA的合并等效于参数矩阵的乘积运算，该过程可以在不增加大量计算开销的情况下完成能力扩展。

技术关键词

模块参数计算机程序指令数据计算机程序产品计算机设备可读存储介质预训练模型扩展系统人工智能技术电子设备处理器非线性存储器矩阵

系统为您推荐了相关专利信息

肿瘤效应B细胞在结直肠癌肝转移的应用方法及系统

肿瘤杀伤效应肿瘤微环境直肠癌液体活检技术表达肿瘤抗原

一种深度学习驱动的热传导方程智能分析方法及系统

热传导方程智能分析方法节点特征矩阵径向基函数插值方法

一种医废数据的处理方法、装置及计算设备

数据分类模型训练集设备可读存储介质时间段模块

基于协议组件的物联网关配置方法、数据处理方法和装置

机电设备协议物联网关数据处理方法数据依赖关系

一种面向复杂场景的具身智能机器人感知决策方法及系统

置信度阈值智能机器人感知决策方法场景策略

基于模块融合的大模型能力扩展方法及系统

站点导航

APP 下载