一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法

正文

推荐专利

申请号：CN202510115032

申请日期：2025-01-24

公开号：CN120046656B

公开日期：2025-12-12

类型：发明专利

摘要

本发明公开了一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法，包括以下步骤：获取多模态问答数据，并将多模态问答数据划分为验证集和测试集；将验证集输入到目标多模态大语言模型中，并通过搜索方法来进行模型各层的冗余度排序；根据冗余度排序，将测试集输入到目标多模态大语言模型中，获取目标多模态大语言模型每一层的冗余度大小；根据冗余度大小，对目标多模态大语言模型的部分层进行关于视觉令牌处理的加速操作。本发明利用视觉令牌所需算力要少于文本令牌的特点，通过定位大语言模型中的冗余层并对其中关于视觉令牌的自注意力操作和前馈神经网络操作进行优化，实现模型推理效率的大幅提升。

技术关键词

大语言模型多模态前馈神经网络冗余度令牌搜索方法注意力视觉文本解码器架构计算机装置指标序列图片处理器数据可读存储介质索引存储器标记

系统为您推荐了相关专利信息

可视化洪水淹没预测方法、装置、电子设备和存储介质

水文时间序列多模态图像数字高程模型数据空间特征提取

AI术前模拟手术的风险预测方法及系统

风险预测方法表型特征患者手术路径规划生命体征数据

一种电网基建项目的可研智能评审方法及系统

电网基建项目智能评审方法大语言模型统计特征字符

一种测试数据集生成方法、装置、介质及产品

生成方法数据库查询技术智能测试技术策略代码覆盖率

一种基于大语言模型的智能医疗随访系统

医疗随访系统大语言模型隐私保护模块数据管理模块语音识别模块

一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法

站点导航

APP 下载