基于模块融合的大模型能力扩展方法及系统

AITNT
正文
推荐专利
基于模块融合的大模型能力扩展方法及系统
申请号:CN202510016701
申请日期:2025-01-06
公开号:CN120069059A
公开日期:2025-05-30
类型:发明专利
摘要
本发明公开一种基于模块融合的大模型能力扩展方法及系统,属于人工智能技术领域。本发明通过引入LoRA模块和融合模块,优化了大规模预训练模型在引入新任务时的能力扩展,保持了较高的微调和推理效率;通过任务数据的抽样重放,有效缓解了不同任务数据质量差异带来的问题,降低了适应新任务的难度。此外,由于本发明设计的模型结构不含有非线性层,因此多个LoRA的合并等效于参数矩阵的乘积运算,该过程可以在不增加大量计算开销的情况下完成能力扩展。
技术关键词
模块 参数 计算机程序指令 数据 计算机程序产品 计算机设备 可读存储介质 预训练模型 扩展系统 人工智能技术 电子设备 处理器 非线性 存储器 矩阵
系统为您推荐了相关专利信息
1
肿瘤效应B细胞在结直肠癌肝转移的应用方法及系统
肿瘤杀伤效应 肿瘤微环境 直肠癌 液体活检技术 表达肿瘤抗原
2
一种深度学习驱动的热传导方程智能分析方法及系统
热传导方程 智能分析方法 节点特征 矩阵 径向基函数插值方法
3
一种医废数据的处理方法、装置及计算设备
数据分类模型 训练集 设备可读存储介质 时间段 模块
4
基于协议组件的物联网关配置方法、数据处理方法和装置
机电设备 协议 物联网关 数据处理方法 数据依赖关系
5
一种面向复杂场景的具身智能机器人感知决策方法及系统
置信度阈值 智能机器人 感知决策方法 场景 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号