模型推理方法及装置

正文

推荐专利

模型推理方法及装置

申请号：CN202410980431

申请日期：2024-07-19

公开号：CN118674050A

公开日期：2024-09-20

类型：发明专利

摘要

本发明提供一种模型推理方法及装置，方法包括：对至少一个第一注意力头中的键向量进行位置编码后，基于位置编码后的查询向量、位置编码后的键向量以及值向量确定第一注意力计算结果；基于其余注意力头的键向量、值向量以及位置编码后的查询向量，确定其余注意力头的第二注意力计算结果；基于第一注意力计算结果以及第二注意力计算结果进行模型推理，得到当前推理结果；在确定第二注意力计算结果的过程中，若确定当前输入对应分词与历史分词相同，则对第二注意力计算结果对应注意力头的相应键值信息进行压缩。本发明在对第二注意力计算结果对应注意力头的相应键值信息进行压缩时没有丢弃重要信息，将高度冗余的信息进行压缩，接近无损压缩。

技术关键词

注意力推理方法键值分词编码非暂态计算机可读存储介质文本生成模型推理装置处理器计算机程序产品存储器电子设备冗余

系统为您推荐了相关专利信息

一种基于V-net对血管分割以及特征值提取和数据整合的方法

血管模型血管分割特征值节点多项式

用于大气污染物输送路径识别的后向轨迹分析方法和装置

轨迹分析方法社区结构自动编码器轨迹聚类算法模拟模型

检验科抽血序号与检验信息整合方法及系统

实时监测数据信息区块链信息整合方法实时数据监测节点

一种矿工入井穿戴设备识别方法、装置、介质和设备

成分分析穿戴设备网络输出端融合特征

一种基于深度学习的综合防沙体系服役寿命评估系统

寿命评估系统防沙体系服役寿命预测局部时空特征多维特征数据

模型推理方法及装置

站点导航

APP 下载