摘要
本申请公开了一种数据处理方法、系统、电子设备、存储介质和计算机程序产品,涉及大模型技术、键值缓存技术领域。其中,该方法包括:获取视觉语言模型对应的多个视觉标记、多个文本标记以及初始键值数据;利用初始键值数据,确定多个文本标记中的关键文本标记;利用初始键值数据和关键文本标记在多个文本标记中的分布位置,对多个视觉标记进行重要度评估,得到评估结果,评估结果用于表征多个视觉标记与关键文本标记之间跨模态的注意力权重分布;根据评估结果,对初始键值数据进行缓存压缩处理,得到目标键值数据。本申请解决了相关技术中视觉语言模型的键值数据缓存开销大、影响模型推理效率的技术问题。
技术关键词
数据处理方法
键值
文本
标记
视觉
注意力
多模态
应用程序编程接口
操作界面
计算机程序产品
参数
矩阵
跨模态
可读存储介质
图形用户界面
客户端
电子设备
数据处理系统
缓存技术
系统为您推荐了相关专利信息
订单识别方法
手部关键点
商品包装袋
运动向量
左手
缺陷检测方法
令牌
图像块特征提取
交叉注意力机制
优化网络参数