一种基于正交特征的大语言模型量化方法及加速器架构

AITNT
正文
推荐专利
一种基于正交特征的大语言模型量化方法及加速器架构
申请号:CN202511587377
申请日期:2025-11-03
公开号:CN121031687A
公开日期:2025-11-28
类型:发明专利
摘要
本发明属于大语言模型量化技术领域,具体涉及一种基于正交特征的大语言模型量化方法及加速器架构,量化方法将大语言模型的激活张量分割为多个列块,并以列块为粒度为整个激活张量分配FP4量化格式。本发明列块的概念定义为:将激活张量的矩阵分割为多个元素数量相同的段,其中段中各元素连续排列在矩阵的第一维度的同一行中,且排列在第二维度的连续的多个列中;列块包括第二维度的多个列,每个列块中列的数量与段中元素的数量一致。本发明克服了现有大语言模型分组量化技术中存在的缺陷,解决了大语言模型精度与硬件效率之间的矛盾。
技术关键词
格式 地址生成器 加速器 索引 大语言模型 数据 缩放单元 指数 执行矩阵乘法 元素 阵列 乘法器 核心 符号 处理单元 因子 模块 分割方法 周期
系统为您推荐了相关专利信息
1
基于工艺知识图谱的方案智能推理生成方法
智能推理 生成方法 知识管理软件 工艺管理系统 图谱
2
自适应共情的智能对话方法、装置、电子设备及存储介质
智能对话方法 专业 情感分析模型 非暂态计算机可读存储介质 智能对话装置
3
一种基于ResUnet++模型的光学影像图像分割方法
图像分割方法 影像 三通道 标签文件 多通道
4
一种多模态数据样本的生成方法及电子设备
多模态 数据验证 句法结构 样本 指令
5
显示文本处理方法、装置、设备及计算机可读存储介质
文本处理方法 格式 模式 文本处理装置 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号