摘要
本发明公开了一种基于混合专家微调的开放词汇目标检测方法及系统。本发明以Grounding DINO模型作为预训练模型,通过在原有的解码器中的前馈神经网络模块和特征强化模块中的交叉注意力模块中分别引入混合专家(MoE)模块,使得不同的专家组合可以处理不同的语义信息的token,从而增强网络的开放词汇检测能力。本发明首次将混合专家系统引入到Grounding DINO模型中,数据集上的实验结果表明本发明微调得到的模型的开放词汇检测能力得到了提升。同时,本发明方法也可以作为插件,加入到其他Transformer结构中,并且不会产生过多的推理开销。
技术关键词
前馈神经网络
模块
注意力
路由器
文本
计算机电子设备
混合专家系统
解码器
线性
图像
机制
预训练模型
存储计算机程序
计算机程序产品
参数
处理器
存储器
数据
指令
插件
系统为您推荐了相关专利信息
形变补偿方法
无线超声探头
原始图像数据
图像结构
卷积网络模型
数据项
编码向量
自动生成方法
资产
自动生成系统
机组控制方法
分散式风电
机侧变流器
电路模块
PI控制器参数