一种基于多维度剪枝的多模态推理模型加速方法

AITNT
正文
推荐专利
一种基于多维度剪枝的多模态推理模型加速方法
申请号:CN202510271349
申请日期:2025-03-08
公开号:CN120180364A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种基于多维度剪枝的多模态推理模型加速方法,首先采用元路由器,基于简单高效的自注意力模型,用于自适应地组织剪枝工作流;然后考虑到传统的基于规则的令牌选择方法仅能提供有限的参考,引入了高斯噪声来扩展搜索空间;最后不依赖人工或自动化标注,利用模型输出的变化情况作为自监督信号动态优化元路由器。使用本发明的方法所加速的多模态推理模型在八个基准测试上达到了与最先进模型相当的性能,实现了模型的有效加速。
技术关键词
令牌 路由器 计算机存储介质 存储计算机程序 扩展搜索空间 计算机程序产品 视觉 处理器 文本 注意力模型 多模态 模型压缩 多层感知机 存储器 样本 注意力机制 序列 依赖人工 电子设备 工作流
系统为您推荐了相关专利信息
1
一种推荐内容整合方法及相关装置
内容整合方法 大语言模型 意图识别 参数 数据
2
无人船集群的自组织协同围捕控制方法、装置及设备
无人船集群 围捕控制方法 状态观测器 欠驱动无人船 扰动观测器
3
在大模型训练场景下的NUMA调度方法、装置、设备及介质
图形处理器 节点 训练场景 策略 关系
4
一种科技成果查重方法、装置、设备及可读存储介质
卷积模型 查重方法 词语 矩阵 报告
5
一种基于历史航迹的机场进离场雷雨绕飞方案分析系统
航迹数据 水平航迹 飞行航迹 飞机 气象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号