一种基于注意力机制的大模型优化方法及系统

AITNT
正文
推荐专利
一种基于注意力机制的大模型优化方法及系统
申请号:CN202510380950
申请日期:2025-03-28
公开号:CN120218251B
公开日期:2025-11-18
类型:发明专利
摘要
本发明属于深度学习技术领域,针对大模型计算资源消耗大、内存占用高及可解释性差等问题,提出一种基于注意力机制的大模型优化方法及系统。方法上,先联合K、V参数矩阵为大KV矩阵,用动态自适应张量分解降维;在各数据处理步骤添加解释层标记处理过程;采用隐式专家协同模型,以门控网络生成权重分解中间计算。其中,张量分解通过NLP模型和拓扑模型预测最优秩并扩展为三阶张量;隐式专家协同模型共享基础参数矩阵、用门控系数组合子网络并实现隐式稀疏性。经实验验证,该方法能缩短计算时间、减少内存占用、提升计算速度、增强模型可解释性与适应性,有效优化大模型性能。
技术关键词
模型优化方法 注意力机制 矩阵 动态门控 秩预测方法 模型优化系统 信息传输通道 图像特征数据 网络 参数 深度学习技术 数据处理模块 标记 元素 自然语言 内存 连线 文本 复杂度
系统为您推荐了相关专利信息
1
车载芯片卷积神经网络的校验方法及装置
数据 校验方法 芯片 校验装置 汽车
2
变压器设备风险预警方法及装置、电子设备、存储介质
变压器设备 风险预警方法 初始聚类中心 变电站设备 风险预警技术
3
一种环保运维机器人视觉系统及环保运维机器人
运维机器人 图像采集模块 图像处理模块 旋转角 矩阵
4
一种智能化码头桥吊作业时间预测方法、系统及电子设备
时间预测方法 码头 神经网络预测模型 灰色关联分析法 蒙特卡洛
5
一种基于大数据的金融数据风控系统及方法
风控系统 强化学习框架 大数据 知识图谱构建 数据安全共享
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号