模型推理方法和装置

正文

推荐专利

模型推理方法和装置

申请号：CN202510388382

申请日期：2025-03-28

公开号：CN120235242A

公开日期：2025-07-01

类型：发明专利

摘要

公开了一种模型推理方法和装置。该方法包括：对输入文本进行预处理以将其转换为语义向量序列；通过降维映射和键‑值映射，计算语义向量序列对应的压缩键和压缩值矩阵并将其存入预设缓存空间中；响应于循环结束条件未被满足，循环执行下述步骤：基于针对目标语义向量以及预设缓存空间中存储的压缩键和压缩值矩阵的第一线性变换，计算当前注意力表示；基于当前注意力表示生成新语义向量并更新语义向量序列；通过降维映射和键‑值映射，计算新语义向量对应的压缩键向量和压缩值向量并更新压缩键矩阵和压缩值矩阵。根据本申请的模型推理方法可以在保证模型推理效果和性能的同时显著提升推理效率。

技术关键词

语义向量矩阵序列多头注意力机制推理方法文本计算机可读指令前馈神经网络推理装置计算机程序产品处理器分块可读存储介质存储器模块分词字符

系统为您推荐了相关专利信息

一种靶机大攻角飞行鲁棒H∞控制方法及系统

靶机鲁棒控制系统求解线性矩阵方向舵误差模型

基于半监督聚类算法的自治系统组织机构映射方法及装置

半监督聚类号码映射方法矩阵组织

一种多模态情绪分析系统及方法

多模态情绪情绪特征分析系统代表文本

基于时间核平稳广义学习系统的炼铁过程异常检测方法

异常检测方法宽度学习系统参数优化算法广义变量

一种基于选区激光熔化的打印路径优化方法

选区激光熔化路径优化方法平衡二叉树蚁群算法三维模型

模型推理方法和装置

站点导航

APP 下载