面向大算力芯片的权重矩阵压缩方法、装置、设备和存储介质产品

AITNT
正文
推荐专利
面向大算力芯片的权重矩阵压缩方法、装置、设备和存储介质产品
申请号:CN202510851463
申请日期:2025-06-24
公开号:CN120856156A
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及一种面向大算力芯片的权重矩阵压缩方法、装置、设备和存储介质产品。所述方法包括:对原始权重矩阵进行比特切片处理,得到至少两个比特切片矩阵;对至少两个比特切片矩阵进行分类,得到至少一个第一比特切片矩阵和至少一个第二比特切片矩阵;对至少一个第二比特切片矩阵进行编码处理,得到至少一个编码后的第二比特切片矩阵;根据至少一个第一比特切片矩阵和至少一个编码后的第二比特切片矩阵,确定压缩后的权重矩阵;第二比特切片矩阵的稀疏率大于第一比特切片的稀疏率;压缩后的权重矩阵应用于Transformer网络的模型训练中。采用本方法能够降低权重矩阵存储负载,从而加快访存速度、提高系统整体性能。
技术关键词
切片 矩阵压缩方法 存储介质产品 计算机程序产品 处理器 压缩装置 元素 芯片 编码模块 计算机设备 可读存储介质 网络 存储器 关系 速度
系统为您推荐了相关专利信息
1
基于知识图谱和语义分析的教学评估方法及相关设备
测试题 知识点 教学评估方法 答题数据 语义
2
一种工业边缘网关的数据传输方法及系统
网关 队列 数据传输方法 服务器 数据传输成功率
3
一种基于大模型的检索增强型智能问答方法及系统
文本 重构 智能问答方法 语义特征 企业
4
一种基于文件交互实现集群数据批量处理的方法及系统
集群 登记表 数据处理模块 hash算法 主节点
5
路径规划的方法、装置及存储介质
层级 路径规划算法 终点 路段 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号