大语言模型的改进方法及电子设备和存储介质

AITNT
正文
推荐专利
大语言模型的改进方法及电子设备和存储介质
申请号:CN202510769614
申请日期:2025-06-10
公开号:CN120688565A
公开日期:2025-09-23
类型:发明专利
摘要
本发明公开一种大语言模型的改进方法及电子设备和存储介质,其中方法包括:通过公开的数据集计算中间层之间的相关矩阵,基于中间层之间的相关矩阵计算各层之间的互信息冗余度,并通过各层之间的互信息冗余度构建层间冗余矩阵;基于冗余矩阵计算每一层的总冗余度,并通过函数转换生成层重要性因子;基于层重要性因子建立目标函数并构建各层稀疏率分配的线性优化模型;采用线性规划算法求解优化模型,得到各层最优稀疏率分配方案;根据分配方案对每层权重矩阵进行差异化剪枝,保留各层权重矩阵中幅度最大的权重参数,并将其余参数置零,得到稀疏化后的权重矩阵。该方法能够在中间层中选择性地剪枝特征,从而实现对大型语言模型的细粒度优化。
技术关键词
冗余度 中间层 线性规划算法 大语言模型 矩阵 因子 注意力 电子设备 度量 处理器通信 计算方法 参数 网络 存储器 数据 定义 指令
系统为您推荐了相关专利信息
1
单视角图像相机标定方法及系统
相机标定方法 编码器 图像 视角 模型训练模块
2
一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备
配电网单相接地故障 配电网馈线 馈线开关 深度强化学习 开关特征
3
仿真无人机的调度方法、装置、电子设备及存储介质
卫星影像数据 仿真平台 三维模型 矢量地图 电池仿真模型
4
一种基于多源数据融合与AI驱动的头颈癌患者症状管理方法及数智化系统
临床辅助决策 头颈 管理方法 患者 可穿戴设备数据
5
一种全自助眼底照分析方法、装置、存储介质及系统
分析方法 眼底图像分割 空间邻域信息 像素点 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号