摘要
本公开的发明名称是“神经网络缩放因子的层次结构”。本文中描述的实施例提供了在将神经网络数据量化为缩减位表示时便于分层缩放的技术。该技术包括以下操作:加载与神经网络相关联的张量的分层缩放图;基于分层缩放图将张量分区成多个区域,所述多个区域分别包括一个或多个子区域;经由矩阵加速器电路模块基于第一缩放因子和第二缩放因子来分层缩放张量的数值,第一缩放因子基于所述多个区域中的区域内的数值的子区域的统计度量,并且第二缩放因子基于包括该子区域的该区域的统计度量;以及经由分层缩放数值的量化来生成张量的量化表示。
技术关键词
图形处理器
因子
分层
度量
数值
机器可读介质
数据处理系统
电路模块
资源
加速器装置
量化误差
分区
机器学习模型
集合体
集群
矩阵
阶段
存储器装置
系统为您推荐了相关专利信息
负荷预测模型
卷积神经网络模型
数值天气预报数据
长短期记忆网络
历史负荷数据
无人机中继通信
中继无人机
计算方法
聚类优化方法
矩阵
映射方法
网络流量分类模型
资源分配策略
网络流量特征
网络资源利用效率
数字转盘
动态分配方法
休眠策略
定时器
轮询机制