摘要
本申请公开了一种模型的数据处理方法,用于人工智能技术领域。本申请方法包括:首先,获取业务数据对应的输入向量,输入向量为其对应的隐向量且携带键信息和值信息。接着,采用压缩矩阵对输入向量进行维度压缩得到压缩向量,再将压缩向量添加到键值缓存中。通过压缩矩阵对维度较高、占用较多存储空间的输入向量进行维度压缩,得到的压缩向量维度降低,大大减少了所需的存储空间。将这些压缩向量存入键值缓存,降低了存储成本,能有效提升缓存空间的利用率。在进行注意力计算时,从键值缓存中取出压缩向量,利用上采样矩阵对其进行键值转换,还原出键向量和值向量,通过还原出的键向量和值向量进行注意力处理,保证了模型的准确性和性能。
技术关键词
数据处理方法
矩阵
注意力机制
上采样
键值
网络
数值
数据处理装置
人工智能技术
申请方法
计算机程序产品
特征值
处理器
计算机设备
层级
参数
存储模块
可读存储介质
系统为您推荐了相关专利信息
高性能抗静电
熔体
氮化硅晶须
序列
硅烷偶联剂改性
桥梁监测方法
微波雷达
载荷桥梁
桥耦合振动模型
非线性
闭环管理方法
数字孪生模型
仿真模型
设备运行状态
多源异构数据
屏蔽泵
可视化技术
故障识别方法
模式识别模型
故障知识库