摘要
本发明提供一种原生支持FP8数制块量化大模型的张量核部件及芯片,涉及人工智能芯片技术领域,包括解压缩层和计算层,解压缩层用于对8比特位浮点数数制的两个浮点数矩阵中的浮点数元素进行解压缩处理,得到两个浮点数矩阵各自对应的预设比特位格式的浮点数元素;计算层用于对8比特位浮点数数制量化结果和8比特位浮点数数制量化结果对应的缩放因子进行乘加操作,得到量化还原结果,并对量化还原结果进行规格化处理,得到目标比特位格式浮点数,其中,8比特位浮点数数制量化结果是通过对激活值矩阵对应的所有浮点数元素和权重值矩阵对应的所有浮点数元素进行指数处理和尾数处理得到的。本发明节省了片内存储容量和带宽,提升整体运算效率。
技术关键词
浮点数
指数
符号
格式
元素
模块
人工智能芯片技术
因子
整体运算效率
比特数
矩阵乘法运算
索引
乘法器
加法器
表达式
系统为您推荐了相关专利信息
深度学习算法
静态图像数据
动态图像数据
面部特征
识别算法
负荷预测模型
控制策略
注意力
指数
时序神经网络
开关柜绝缘状态
监测管理系统
指数
滑动窗口技术
特征值