摘要
本发明提供一种基于参数制约的大语言模型知识融合方法及装置,涉及知识融合技术领域。该方法包括:获取多个任务模型;采用非线性激活函数对多个任务模型中的任务向量进行冗余参数抑制,获得冗余参数的抑制程度;采用非线性激活函数计算初始任务向量中相同位置参数的相似性;根据冗余参数的抑制程度以及相似性,获得任务向量中的参数重要性得分;根据任务向量中的参数重要性得分,获得最终合并的任务向量;将最终合并的任务向量进行重新缩放,生成合并后的任务模型参数。采用本发明可提升大语言模型合并性能。
技术关键词
知识融合方法
计算机可读取存储介质
融合装置
计算机可读指令
非线性
融合设备
预训练模型
超参数
智能优化算法
进化策略
大语言模型
协方差矩阵
元素
处理器
存储器
系统为您推荐了相关专利信息
加密数据
SM4算法
非易失性存储介质
数据保护方法
计算机可读指令
电阻系统
模糊PID控制器
电磁屏蔽结构
非线性补偿算法
温度补偿模块
快速计算方法
效应
查找表
气溶胶光学厚度
全局敏感性分析方法