一种大模型自注意力优化方法、装置、设备及介质

正文

推荐专利

申请号：CN202510025947

申请日期：2025-01-08

公开号：CN119443183B

公开日期：2025-07-22

类型：发明专利

摘要

本发明提供的一种大模型自注意力优化方法、装置、设备及介质，涉及人工智能技术领域。本发明通过获取输入序列经大模型自注意力结构后得到的KQ大矩阵，将KQ大矩阵分成若干个KQ小矩阵；对每个KQ小矩阵进行局部注意力计算，并与其他KQ小矩阵进行相似度的降序排序，得到排序列表；对于输入序列中的每个元素，根据计算出的排序列表，选取相似度排名前r中的KQ小矩阵对应的局部注意力进行加权计算，作为当前元素的注意力表示，直到完成所述输入序列的全部元素，得到所述输入序列优化后的注意力结果。本发明不仅降低了模型的计算复杂度，而且能捕捉远距离的上下文信息，提高了模型的准确性。

技术关键词

注意力矩阵元素序列列表计算机可读指令可读存储介质音视频人工智能技术优化设备优化装置数据处理器文本存储器远距离复杂度图像

系统为您推荐了相关专利信息

基于强鲁棒灰色关联分析的置信度评估方法及装置

仿真数据仿真模型灰色关联分析置信度评估方法灰色关联度

一种基于多源数据融合的煤层增透效果预测方法

交叉注意力机制特征提取网络依赖特征跨模态数据变量

一种零部件3D图纸智能核价方法及系统

智能核价方法刀具图纸局部特征量化参数

一种智能光照加热方法及装置

光照加热装置参数优化模型物体加热方法光热

基于多特征融合的脑动脉瘤智能检测与定位方法及系统

血管造影图像网络节点网络拓扑密度聚类方法多尺度特征提取

一种大模型自注意力优化方法、装置、设备及介质

站点导航

APP 下载