神经网络模型的压缩方法、设备、存储介质及程序产品

AITNT
正文
推荐专利
神经网络模型的压缩方法、设备、存储介质及程序产品
申请号:CN202410978151
申请日期:2024-07-19
公开号:CN118504643B
公开日期:2025-01-07
类型:发明专利
摘要
本说明书一个或多个实施例提供一种神经网络模型的压缩方法、设备、存储介质及程序产品。该方法包括:将第一数据样本输入待压缩的神经网络模型进行推理,以获取在推理过程中由多头注意力结构产生的键值缓存数据集;键值缓存数据集包括与多头注意力结构中的多个注意力头一一对应的多个键值缓存数据;按照至少两个注意力头为一组的方式,对键值缓存数据集中的多个键值缓存数据进行划分,得到与各组对应的键值缓存数据子集;对与各组对应的键值缓存数据子集进行奇异值分解,得到与各组对应的压缩权重;利用与各组对应的压缩权重对各组包括的至少两个注意力头的模型参数进行压缩处理,以将多头注意力结构压缩为分组查询注意力结构。
技术关键词
注意力 神经网络模型 键值 矩阵 参数 神经网络推理 处理器 指令 解码器 计算机程序产品 样本 可读存储介质 编码 电子设备 数据 存储器
系统为您推荐了相关专利信息
1
三维场景渲染处理方法及装置
三维模型 场景 矩阵 布局方式 布局界面
2
具有多级瓷壳结构的真空灭弧室绝缘结构调节方法
图纸 电场 等效电路模型 仿真模型 瓷壳结构
3
基于改进灰狼算法的船舶会遇避碰方法
灰狼算法 静态障碍物 位置更新 船舶 场景
4
基于跨模态注意力机制的对抗攻击检测方法与系统
跨模态融合特征 交叉注意力机制 稀疏特征提取 视觉 雷达点云数据
5
一种基于体素不确定性的医学影像分割模型学习系统
学习系统 标签 模型训练模块 校准误差 感兴趣
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号