注意力机制计算的优化方法、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510576855

申请日期：2025-04-30

公开号：CN120087414B

公开日期：2025-08-12

类型：发明专利

摘要

本申请实施例提供了一种注意力机制计算的优化方法、设备、存储介质及程序产品，涉及人工智能技术领域，该方法包括：基于查询分块和键分块执行前向重计算算子获得前向归一化结果。基于输出梯度分块和前向归一化结果执行第一矩阵乘算子获得值中间结果，同时并行基于前向输出分块和输出梯度分块执行点乘求和算子，获得中间张量。对值中间结果执行第一类型变换算子，获得值梯度分块；同时并行基于输出梯度分块、值分块、中间张量和前向归一化结果执行梯度反向传播算子，获得反向归一化结果。最后基于反向归一化结果、键分块和查询分块，获得查询梯度分块和键梯度分块，实现对不同算子做有效的流水线处理，从而提升注意力机制计算的整体性能。

技术关键词

分块人工智能芯片矩阵计算机设备注意力机制计算机程序产品可读存储介质人工智能技术序列存储器流水线指令数据

注意力机制计算的优化方法、设备、存储介质及程序产品

站点导航

APP 下载