基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置

正文

推荐专利

申请号：CN202411951125

申请日期：2024-12-27

公开号：CN119761519B

公开日期：2025-08-05

类型：发明专利

摘要

本申请提供了一种基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置，涉及人工智能技术领域，旨在加速多模态大模型的推理速度。该方法包括：将目标图像输入视觉编码器进行多层注意力交互，得到由多个视觉令牌组成的视觉令牌序列，以及多层类令牌对视觉令牌的注意力分数分布；根据所述多层类令牌对视觉令牌的注意力分数分布，确定出类令牌对各个视觉令牌的最终注意力分数，所述最终注意力分数表征视觉令牌的重要度；根据所述类令牌对各个视觉令牌的最终注意力分数，从所述视觉令牌序列中选择出重要度高的多个目标视觉令牌；将所述多个目标视觉令牌和文本提示输入语言模型进行推理，得到推理结果。

技术关键词

令牌视觉多层注意力序列多模态文本输入模块处理器人工智能技术加速装置计算机程序产品语义图像处理可读存储介质存储器电子设备

基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置

站点导航

APP 下载