深度学习推理平台及深度学习推理引擎的运行方法、系统

正文

推荐专利

申请号：CN202510424545

申请日期：2025-04-07

公开号：CN120297344A

公开日期：2025-07-11

类型：发明专利

摘要

本公开提供了一种深度学习推理平台及深度学习推理引擎的运行方法、系统。该深度学习推理引擎搭载在处理器中，该运行方法包括：加载训练完成的推理模型，建立张量缓存管理器，并预先分配输出张量；接收输入数据并获取输入数据对应的初始张量，对初始张量进行张量重塑得到目标维度的目标张量，将目标张量存储至张量缓存管理器的第一缓存变量中；调用第一缓存变量中的目标张量并对目标张量进行混合注意力计算，得到混合注意力计算结果；将混合注意力计算结果写入输出张量进行输出。本公开能够动态适配多步解码或高并发情形，能够适应多样化的文本、音频或其他序列数据等场景，使得深度学习推理引擎具有更高的通用性和可扩展性，提高系统性能。

技术关键词

缓存管理器推理平台变量处理器包装器注意力机制输出模块数据场景计算机程序产品矩阵间距可读存储介质存储器元素序列电子设备内存

系统为您推荐了相关专利信息

一种基于MR与多模态脑机接口的群体多场景认知训练方法

认知训练方法多模态生理脑机接口能力评估模型多场景

一种斜冠簧大电流连接器结构设计建模方法

电流连接器建模方法 APDL语言回归预测模型三维建模软件

轮足机器人导航中的局部规划方法、装置及电子设备

轮足机器人模式连线直线运动

一种改进YOLOv5s模型的轻量化变电缺陷识别检测方法及系统

识别检测方法识别检测系统检测变电设备注意力机制聚类

储能设备的检测方法及装置、电子设备

单体电池多维特征向量充放电数据储能设备因子

深度学习推理平台及深度学习推理引擎的运行方法、系统

站点导航

APP 下载