基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端

AITNT
正文
推荐专利
基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端
申请号:CN202510389385
申请日期:2025-03-31
公开号:CN120373358A
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于TTD压缩的多头潜在注意力模型的数据处理方法、系统及终端,所述方法包括:构建大语言模型,通过TTD压缩、分解的方式对大语言模型中的多个线性层进行处理,从而减少了模型中的权重数量,在硬件层面针对TTD压缩后线性层推理的数据流进行针对性优化,从而输出最后的模型推理结果。本发明通过转化为大语言模型中的多头潜在注意力结构,从而减少模型推理时对KV cache的需求,通过减少权重数量,提高模型在边缘设备上的长文本输出能力,后续采用组矢量脉动阵列的计算结构去进行推理过程中的矩阵计算,高效地利用了有限的硬件资源。
技术关键词
注意力模型 数据处理方法 大语言模型 网络结构 脉动阵列架构 数字信号处理器 线性 数据处理程序 矩阵 双倍数据速率内存 SVD分解方法 数据处理系统 结构网络 序列 输入加法器 可读存储介质 上采样 切片
系统为您推荐了相关专利信息
1
一种辅助盲人就诊的医院内部定位、导航及避障系统
辅助盲人 云端服务器 空间坐标信息 医院 障碍物
2
一种代码缺陷智能修复的方法、装置、计算机设备及介质
代码缺陷 大语言模型 代码转换 电子信息技术技术 计算机设备
3
一种用于电阻阵列红外成像目标模拟系统的数据处理方法
图像块 数据处理方法 图像金字塔 模拟系统 对象
4
用于分析产品市场特征的方法及装置、电子设备
大语言模型 社交媒体平台 标签 电子设备本体 生成关键词
5
融合大模型知识的数学应用题智能解答方法与系统
智能解答方法 注意力 符号 推理系统 编码向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号