一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法

AITNT
正文
推荐专利
一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法
申请号:CN202510115032
申请日期:2025-01-24
公开号:CN120046656B
公开日期:2025-12-12
类型:发明专利
摘要
本发明公开了一种基于视觉令牌高效处理的多模态大语言模型免训练加速方法,包括以下步骤:获取多模态问答数据,并将多模态问答数据划分为验证集和测试集;将验证集输入到目标多模态大语言模型中,并通过搜索方法来进行模型各层的冗余度排序;根据冗余度排序,将测试集输入到目标多模态大语言模型中,获取目标多模态大语言模型每一层的冗余度大小;根据冗余度大小,对目标多模态大语言模型的部分层进行关于视觉令牌处理的加速操作。本发明利用视觉令牌所需算力要少于文本令牌的特点,通过定位大语言模型中的冗余层并对其中关于视觉令牌的自注意力操作和前馈神经网络操作进行优化,实现模型推理效率的大幅提升。
技术关键词
大语言模型 多模态 前馈神经网络 冗余度 令牌 搜索方法 注意力 视觉 文本 解码器架构 计算机装置 指标 序列 图片 处理器 数据 可读存储介质 索引 存储器 标记
系统为您推荐了相关专利信息
1
可视化洪水淹没预测方法、装置、电子设备和存储介质
水文时间序列 多模态 图像 数字高程模型数据 空间特征提取
2
AI术前模拟手术的风险预测方法及系统
风险预测方法 表型特征 患者 手术路径规划 生命体征数据
3
一种电网基建项目的可研智能评审方法及系统
电网基建项目 智能评审方法 大语言模型 统计特征 字符
4
一种测试数据集生成方法、装置、介质及产品
生成方法 数据库查询技术 智能测试技术 策略 代码覆盖率
5
一种基于大语言模型的智能医疗随访系统
医疗随访系统 大语言模型 隐私保护模块 数据管理模块 语音识别模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号