基于混合专家的视觉语言模型的令牌路由增强方法

正文

推荐专利

申请号：CN202510478446

申请日期：2025-04-16

公开号：CN120434169A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种基于混合专家的视觉语言模型的令牌路由增强方法，本发明是即插即用的，可以在涉及基于混合专家架构的纯视觉模态的模型或者包含视觉模态的多模态模型上实现视觉令牌的高效路由。模态特定的路由策略使得本发明能够识别不同模态信息的内在分布，从而分治地进行视觉和其他模态的令牌路由。此外本发明通过令牌路由的概率方差来区分视觉中重要的尾部前景令牌和冗余的头部背景令牌，有助于挖掘视觉信息。并且通过增强各专家对于视觉中重要的尾部前景令牌的学习，使得本发明能够更加高效地捕捉和学习视觉中的重要信息。本发明在纯视觉模态的骨干模型和包含视觉模态的多模态骨干模型上实现了更加先进性能的同时，保持了推理参数量不变。

技术关键词

令牌视觉负载均衡策略序列图像计算机电子设备输出特征词嵌入模型生成数据集前馈神经网络存储计算机程序路由器文本识别样本处理器指令可读存储介质

系统为您推荐了相关专利信息

一种移动监测载体组网优化方法

车辆运行轨迹组网优化方法路段移动监测系统地图匹配算法

一种基于红外成像的输电线路覆冰监控方法及系统

输电线路覆冰输电线路可视化监控方法成像相机标定参数

一种高质量城市低空视觉数据集采集方法

视觉数据集多模态标准化结构多路径多层次

一种非接触多生命体征监测方法及装置

生命体征监测方法脉搏波分词数据网络模块

基于虚拟现实的车辆线上拍卖方法以及系统

拍卖方法界面车辆在线拍卖系统

基于混合专家的视觉语言模型的令牌路由增强方法

站点导航

APP 下载