摘要
本发明公开了一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法,包括以下步骤:获取多模态问答数据,并将多模态问答数据划分为验证集和测试集;将验证集输入到目标多模态大语言模型中,并通过搜索方法来进行模型各层的冗余度排序;根据冗余度排序,将测试集输入到目标多模态大语言模型中,获取目标多模态大语言模型每一层的冗余度大小;根据冗余度大小,对目标多模态大语言模型的部分层进行关于视觉令牌处理的加速操作。本发明利用视觉令牌所需算力要少于文本令牌的特点,通过定位大语言模型中的冗余层并对其中关于视觉令牌的自注意力操作和前馈神经网络操作进行优化,实现模型推理效率的大幅提升。
技术关键词
大语言模型
多模态
前馈神经网络
冗余度
令牌
搜索方法
注意力
视觉
文本
解码器架构
计算机装置
指标
序列
图片
处理器
数据
可读存储介质
索引
存储器
标记
系统为您推荐了相关专利信息
水文时间序列
多模态
图像
数字高程模型数据
空间特征提取
风险预测方法
表型特征
患者
手术路径规划
生命体征数据
电网基建项目
智能评审方法
大语言模型
统计特征
字符
生成方法
数据库查询技术
智能测试技术
策略
代码覆盖率
医疗随访系统
大语言模型
隐私保护模块
数据管理模块
语音识别模块