摘要
本申请公开了一种推理计算方法及相关设备,涉及数据处理技术领域,包括:响应于推理计算指令,获取待推理的初始数据,基于预设推理引擎与预设推理优化策略,对所述初始数据进行推理计算,得到推理计算结果,其中,所述推理计算结果是基于推理计算过程中的注意力确定的,所述注意力是基于kv确定的,所述预设推理优化策略用于对所述kv进行压缩,以减少硬件资源消耗。本申请基于预设推理优化策略,对推理过程中的kv进行压缩,使推理引擎完成注意力计算只需要占用少量的资源,进而,在资源固定的情况下,可以进行更多的计算,加速推理速度。
技术关键词
计算方法
策略
注意力
内存
计算机程序产品
压缩算法
数据处理技术
处理器
样本
可读存储介质
存储器
元素
资源
指令
参数
速度
系统为您推荐了相关专利信息
薄膜热电偶传感器
电芯内部温度
动力电池单体
监测方法
电芯组件
基站休眠方法
网络流量数据
预测网络流量
流量预测模型
动态
大型中央空调
优化控制方法
热传导方程
多模型
空调系统控制技术
协作边缘计算方法
边缘计算环境
无人机基站
遗传算法
无人机飞行轨迹
网络协议解析系统
标识符
协处理器
现场可编程逻辑门阵列
芯片