基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端

正文

推荐专利

申请号：CN202510389385

申请日期：2025-03-31

公开号：CN120373358A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端，所述方法包括：构建大语言模型，通过TTD压缩、分解的方式对大语言模型中的多个线性层进行处理，从而减少了模型中的权重数量，在硬件层面针对TTD压缩后线性层推理的数据流进行针对性优化，从而输出最后的模型推理结果。本发明通过转化为大语言模型中的多头潜在注意力结构，从而减少模型推理时对KV cache的需求，通过减少权重数量，提高模型在边缘设备上的长文本输出能力，后续采用组矢量脉动阵列的计算结构去进行推理过程中的矩阵计算，高效地利用了有限的硬件资源。

技术关键词

注意力模型数据处理方法大语言模型网络结构脉动阵列架构数字信号处理器线性数据处理程序矩阵双倍数据速率内存 SVD分解方法数据处理系统结构网络序列输入加法器可读存储介质上采样切片

系统为您推荐了相关专利信息

一种辅助盲人就诊的医院内部定位、导航及避障系统

辅助盲人云端服务器空间坐标信息医院障碍物

一种代码缺陷智能修复的方法、装置、计算机设备及介质

代码缺陷大语言模型代码转换电子信息技术技术计算机设备

一种用于电阻阵列红外成像目标模拟系统的数据处理方法

图像块数据处理方法图像金字塔模拟系统对象

用于分析产品市场特征的方法及装置、电子设备

大语言模型社交媒体平台标签电子设备本体生成关键词

融合大模型知识的数学应用题智能解答方法与系统

智能解答方法注意力符号推理系统编码向量

基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端

站点导航

APP 下载