摘要
本申请公开了一种模型推理加速方法、系统、电子设备、存储介质及产品,涉及人工智能技术领域,包括获取第一计算模块中序列化模型的中间变量,中间变量包括键值副本、中间层潜在特征和深层输出特征中至少一项,中间层潜在特征为第一计算模块和第二计算模块中相似度不低于预设相似阈值的特征,中间层潜在特征是由第一计算模块中浅层计算块确定的,深层输出特征是由第一计算模块中深层计算块确定的;确定相似度不低于预设相似阈值的特征为第二计算模块中深层计算块的输入,以使第二计算模块得到序列化模型的预测结果,解决了相关方案中缓存快速膨胀,导致模型推理速度慢的技术问题,达到了减少冗余计算,进而加快模型推理的速度的技术效果。
技术关键词
输出特征
中间层
加速系统
键值
副本
注意力
变量
决策控制模块
电子设备
可读存储介质
存储计算机程序
人工智能技术
计算机程序产品
矩阵
模块通信
处理器
参数
冗余
系统为您推荐了相关专利信息
神经网络模型
数据加载方法
编译方法
数据加载装置
计算机程序产品
注意力机制
融合图像特征
分块
输出特征
卷积特征
融合方法
生成器网络
汉字
生成融合图像
输出特征