一种基于参数制约的大语言模型知识融合方法及装置

正文

推荐专利

申请号：CN202411447063

申请日期：2024-10-16

公开号：CN119475211A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供一种基于参数制约的大语言模型知识融合方法及装置，涉及知识融合技术领域。该方法包括：获取多个任务模型；采用非线性激活函数对多个任务模型中的任务向量进行冗余参数抑制，获得冗余参数的抑制程度；采用非线性激活函数计算初始任务向量中相同位置参数的相似性；根据冗余参数的抑制程度以及相似性，获得任务向量中的参数重要性得分；根据任务向量中的参数重要性得分，获得最终合并的任务向量；将最终合并的任务向量进行重新缩放，生成合并后的任务模型参数。采用本发明可提升大语言模型合并性能。

技术关键词

知识融合方法计算机可读取存储介质融合装置计算机可读指令非线性融合设备预训练模型超参数智能优化算法进化策略大语言模型协方差矩阵元素处理器存储器

系统为您推荐了相关专利信息

一种基于SM4算法的合同数据保护方法及装置

加密数据 SM4算法非易失性存储介质数据保护方法计算机可读指令

一种基于脑卒中患者治疗与体征数据的长期预后预测方法

预后预测方法阶段患者时序指标

一种自适应温度补偿的智能电阻系统及控制方法

电阻系统模糊PID控制器电磁屏蔽结构非线性补偿算法温度补偿模块

一种面向卫星观测的气溶胶地表直接辐射效应快速计算方法

快速计算方法效应查找表气溶胶光学厚度全局敏感性分析方法

基于CNN网络联合SVR微动面波反演二氧化碳运移的监测方法

监测方法地层横波速度网路样本网络

一种基于参数制约的大语言模型知识融合方法及装置

站点导航

APP 下载