摘要
本申请公开了一种模型推理方法、电子设备及存储介质,涉及计算机技术领域,方法包括:获取待处理数据;对待处理数据进行预填充处理,将预填充处理生成的键值缓存保存至第一缓冲区,并向第二缓冲区传输该键值缓存;第一缓冲区属于预填充节点对应的连接器,第二缓冲区属于解码节点对应的连接器;从第二缓冲区加载键值缓存,并进行解码处理;在解码处理的过程中,监控解码节点内的图形处理器的内存利用率,根据内存利用率,调整键值缓存的存放位置;其中,解码节点设置有计算快速链接内存,上述存放位置包括该计算快速链接内存与图形处理器的内存;输出解码处理结果。通过本申请提供的方案,可以有效保障解码效率,进而保障模型推理过程有效运行。
技术关键词
图形处理器
键值
内存
推理方法
解码
通信带宽
节点
电子设备
可读存储介质
存储计算机程序
路由器
计算机程序产品
中央处理器
数据
存储器
系统为您推荐了相关专利信息
负荷预测模型
热启动方法
住宅
解码网络
预测网络模型
推理方法
推理系统
计算机执行指令
大型服务器集群
推理装置