应用于边缘设备的推理加速方法、装置及电子设备

AITNT
正文
推荐专利
应用于边缘设备的推理加速方法、装置及电子设备
申请号:CN202511113382
申请日期:2025-08-08
公开号:CN120633870B
公开日期:2025-11-18
类型:发明专利
摘要
本申请提供应用于边缘设备的推理加速方法、装置及电子设备。本申请通过将预训练模型的权重矩阵N个权重子块,将预训练模型的激活矩阵划分为M个激活子块,以对预训练模型中权重子块以及该权重子块对应的激活子块进行量化处理,得到目标模型;若至少两个权重子块的量化位宽相同,则基于该至少两个权重子块对应的权重值量化超参以及各权重子块对应的激活子块对应的激活值量化超参,将该至少两个权重子块作为一个整体进行量化处理。其中,将相同量化位宽的权重子块以及对应的激活子块进行了整体处理,在加载这些子块时,内存访问模式从随机跳变变换为顺序读写,同时对权重值和激活值进行了量化,提高了模型的推理速度,降低了模型占用的存储空间。
技术关键词
矩阵 机器可读存储介质 预训练模型 内存访问模式 电子设备 处理单元 加速装置 物理 处理器 通道 尺寸 指令 速度
系统为您推荐了相关专利信息
1
一种对称密码组件抗Simon量子攻击能力的量化方法
密码 计算机存储介质 复杂度 处理器 算法
2
光通信网络的动态带宽分配与管理方法及系统
光通信装置 网络流量预测模型 动态带宽分配 光信号 节点特征
3
音频转写方法和装置
场景 文本 音频 样本 客户端
4
多模态数据驱动的教学评估报告自动化生成及智能分析方法
智能分析方法 教育信息系统 多层神经网络模型训练 多模态 增量学习方法
5
基于特征信息的对象评分方法、装置、电子设备及存储介质
规则集 评分方法 训练样本集 主题 概率密度函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号