摘要
本发明提供的一种大模型自注意力优化方法、装置、设备及介质,涉及人工智能技术领域。本发明通过获取输入序列经大模型自注意力结构后得到的KQ大矩阵,将KQ大矩阵分成若干个KQ小矩阵;对每个KQ小矩阵进行局部注意力计算,并与其他KQ小矩阵进行相似度的降序排序,得到排序列表;对于输入序列中的每个元素,根据计算出的排序列表,选取相似度排名前r中的KQ小矩阵对应的局部注意力进行加权计算,作为当前元素的注意力表示,直到完成所述输入序列的全部元素,得到所述输入序列优化后的注意力结果。本发明不仅降低了模型的计算复杂度,而且能捕捉远距离的上下文信息,提高了模型的准确性。
技术关键词
注意力
矩阵
元素
序列
列表
计算机可读指令
可读存储介质
音视频
人工智能技术
优化设备
优化装置
数据
处理器
文本
存储器
远距离
复杂度
图像
系统为您推荐了相关专利信息
仿真数据
仿真模型
灰色关联分析
置信度评估方法
灰色关联度
交叉注意力机制
特征提取网络
依赖特征
跨模态数据
变量
血管造影图像
网络节点
网络拓扑
密度聚类方法
多尺度特征提取