原生支持FP8数制块量化大模型的张量核部件及芯片

AITNT
正文
推荐专利
原生支持FP8数制块量化大模型的张量核部件及芯片
申请号:CN202510931052
申请日期:2025-07-07
公开号:CN120953039A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供一种原生支持FP8数制块量化大模型的张量核部件及芯片,涉及人工智能芯片技术领域,包括解压缩层和计算层,解压缩层用于对8比特位浮点数数制的两个浮点数矩阵中的浮点数元素进行解压缩处理,得到两个浮点数矩阵各自对应的预设比特位格式的浮点数元素;计算层用于对8比特位浮点数数制量化结果和8比特位浮点数数制量化结果对应的缩放因子进行乘加操作,得到量化还原结果,并对量化还原结果进行规格化处理,得到目标比特位格式浮点数,其中,8比特位浮点数数制量化结果是通过对激活值矩阵对应的所有浮点数元素和权重值矩阵对应的所有浮点数元素进行指数处理和尾数处理得到的。本发明节省了片内存储容量和带宽,提升整体运算效率。
技术关键词
浮点数 指数 符号 格式 元素 模块 人工智能芯片技术 因子 整体运算效率 比特数 矩阵乘法运算 索引 乘法器 加法器 表达式
系统为您推荐了相关专利信息
1
一种用于模型训练的深度学习算法
深度学习算法 静态图像数据 动态图像数据 面部特征 识别算法
2
一种基于GPU计算-访存混合感知负载均衡的SpMV方法
多物理场协同 主机端 设备端 二分查找算法 索引
3
温度调节装置的控制方法、装置及电子设备
负荷预测模型 控制策略 注意力 指数 时序神经网络
4
半导体结构及其制备方法、发光阵列及其制备方法
半导体结构 掩膜结构 发光单元 台阶结构 台面
5
开关柜绝缘状态监测管理系统
开关柜绝缘状态 监测管理系统 指数 滑动窗口技术 特征值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号