一种大模型自注意力优化方法、装置、设备及介质

AITNT
正文
推荐专利
一种大模型自注意力优化方法、装置、设备及介质
申请号:CN202510025947
申请日期:2025-01-08
公开号:CN119443183B
公开日期:2025-07-22
类型:发明专利
摘要
本发明提供的一种大模型自注意力优化方法、装置、设备及介质,涉及人工智能技术领域。本发明通过获取输入序列经大模型自注意力结构后得到的KQ大矩阵,将KQ大矩阵分成若干个KQ小矩阵;对每个KQ小矩阵进行局部注意力计算,并与其他KQ小矩阵进行相似度的降序排序,得到排序列表;对于输入序列中的每个元素,根据计算出的排序列表,选取相似度排名前r中的KQ小矩阵对应的局部注意力进行加权计算,作为当前元素的注意力表示,直到完成所述输入序列的全部元素,得到所述输入序列优化后的注意力结果。本发明不仅降低了模型的计算复杂度,而且能捕捉远距离的上下文信息,提高了模型的准确性。
技术关键词
注意力 矩阵 元素 序列 列表 计算机可读指令 可读存储介质 音视频 人工智能技术 优化设备 优化装置 数据 处理器 文本 存储器 远距离 复杂度 图像
系统为您推荐了相关专利信息
1
基于强鲁棒灰色关联分析的置信度评估方法及装置
仿真数据 仿真模型 灰色关联分析 置信度评估方法 灰色关联度
2
一种基于多源数据融合的煤层增透效果预测方法
交叉注意力机制 特征提取网络 依赖特征 跨模态数据 变量
3
一种零部件3D图纸智能核价方法及系统
智能核价方法 刀具 图纸 局部特征量化 参数
4
一种智能光照加热方法及装置
光照加热装置 参数优化模型 物体 加热方法 光热
5
基于多特征融合的脑动脉瘤智能检测与定位方法及系统
血管造影图像 网络节点 网络拓扑 密度聚类方法 多尺度特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号