一种基于注意力机制的大模型优化方法及系统

正文

推荐专利

申请号：CN202510380950

申请日期：2025-03-28

公开号：CN120218251B

公开日期：2025-11-18

类型：发明专利

摘要

本发明属于深度学习技术领域，针对大模型计算资源消耗大、内存占用高及可解释性差等问题，提出一种基于注意力机制的大模型优化方法及系统。方法上，先联合K、V参数矩阵为大KV矩阵，用动态自适应张量分解降维；在各数据处理步骤添加解释层标记处理过程；采用隐式专家协同模型，以门控网络生成权重分解中间计算。其中，张量分解通过NLP模型和拓扑模型预测最优秩并扩展为三阶张量；隐式专家协同模型共享基础参数矩阵、用门控系数组合子网络并实现隐式稀疏性。经实验验证，该方法能缩短计算时间、减少内存占用、提升计算速度、增强模型可解释性与适应性，有效优化大模型性能。

技术关键词

模型优化方法注意力机制矩阵动态门控秩预测方法模型优化系统信息传输通道图像特征数据网络参数深度学习技术数据处理模块标记元素自然语言内存连线文本复杂度

系统为您推荐了相关专利信息

车载芯片卷积神经网络的校验方法及装置

数据校验方法芯片校验装置汽车

变压器设备风险预警方法及装置、电子设备、存储介质

变压器设备风险预警方法初始聚类中心变电站设备风险预警技术

一种环保运维机器人视觉系统及环保运维机器人

运维机器人图像采集模块图像处理模块旋转角矩阵

一种智能化码头桥吊作业时间预测方法、系统及电子设备

时间预测方法码头神经网络预测模型灰色关联分析法蒙特卡洛

一种基于大数据的金融数据风控系统及方法

风控系统强化学习框架大数据知识图谱构建数据安全共享

一种基于注意力机制的大模型优化方法及系统

站点导航

APP 下载