一种基于参数制约的大语言模型知识融合方法及装置

AITNT
正文
推荐专利
一种基于参数制约的大语言模型知识融合方法及装置
申请号:CN202411447063
申请日期:2024-10-16
公开号:CN119475211A
公开日期:2025-02-18
类型:发明专利
摘要
本发明提供一种基于参数制约的大语言模型知识融合方法及装置,涉及知识融合技术领域。该方法包括:获取多个任务模型;采用非线性激活函数对多个任务模型中的任务向量进行冗余参数抑制,获得冗余参数的抑制程度;采用非线性激活函数计算初始任务向量中相同位置参数的相似性;根据冗余参数的抑制程度以及相似性,获得任务向量中的参数重要性得分;根据任务向量中的参数重要性得分,获得最终合并的任务向量;将最终合并的任务向量进行重新缩放,生成合并后的任务模型参数。采用本发明可提升大语言模型合并性能。
技术关键词
知识融合方法 计算机可读取存储介质 融合装置 计算机可读指令 非线性 融合设备 预训练模型 超参数 智能优化算法 进化策略 大语言模型 协方差矩阵 元素 处理器 存储器
系统为您推荐了相关专利信息
1
一种基于SM4算法的合同数据保护方法及装置
加密数据 SM4算法 非易失性存储介质 数据保护方法 计算机可读指令
2
一种基于脑卒中患者治疗与体征数据的长期预后预测方法
预后预测方法 阶段 患者 时序 指标
3
一种自适应温度补偿的智能电阻系统及控制方法
电阻系统 模糊PID控制器 电磁屏蔽结构 非线性补偿算法 温度补偿模块
4
一种面向卫星观测的气溶胶地表直接辐射效应快速计算方法
快速计算方法 效应 查找表 气溶胶光学厚度 全局敏感性分析方法
5
基于CNN网络联合SVR微动面波反演二氧化碳运移的监测方法
监测方法 地层横波速度 网路 样本 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号