自注意力机制中键值压缩方法、大语言模型及电子设备

正文

推荐专利

申请号：CN202510344978

申请日期：2025-03-21

公开号：CN120106150B

公开日期：2025-10-03

类型：发明专利

摘要

本申请公开了自注意力机制中键值压缩方法、大语言模型及电子设备，涉及计算机技术领域。所述压缩方法包括对键矩阵和值矩阵分别进行多次残差分解，得到每次分解后的键残差向量和值残差向量；对每次分解后的键残差向量和值残差向量分别进行聚类压缩，并对查询矩阵、压缩后的键残差向量和值残差向量进行注意力计算；对所有注意力计算结果进行累加。本申请解决了Linear Transformer无法使用标准的Softmax Transformer参数，且与标准Softmax Transformer差异较大的问题。

技术关键词

矩阵注意力机制键值大语言模型聚类模块索引前馈神经网络电子设备指令位置映射计算机程序产品处理器可读存储介质文本存储器编码数据

系统为您推荐了相关专利信息

基于多模态深度学习的喉癌早期智能诊断系统及其方法

多模态数据采集声学特征多模态深度学习子模块高维特征向量

基于生成对抗网络的城市局部碳排放热点预测与调控方法

时空注意力机制矩阵调控策略调控方法多尺度

一种大语言模型Text2SQL单表查询语句生成方法

查询语句生成方法关键词字段大语言模型查询语句生成系统

一种基于对抗剪枝和知识蒸馏的后门防御方法

后门教师学生知识蒸馏技术门槛

一种四轮转向车辆转向卡死跨系统容错控制方法

四轮转向车辆容错控制方法横摆角速度跨系统车辆动力学模型

自注意力机制中键值压缩方法、大语言模型及电子设备

站点导航

APP 下载