摘要
本发明公开了一种面向高效的开放词汇全景分割方法,包括以下步骤:S1、基于多尺度特征提取器和轻量级聚合器进行视觉特征提取和聚合;S2、利用文本编码器对任意类别词汇进行编码,得到文本嵌入S3、基于词汇感知选择模块提升视觉聚合特征的语义理解,减轻掩码解码器的特征交互负担;S4、基于双向动态嵌入专家,通过动态分配专家权重,生成具有语义感知和空间感知的实例嵌入;S5、基于轻量级解码器,使用对象核逐层进行掩码预测和细化,利用对象核和文本嵌入进行点积作为类别预测;该方法在实现相当性能的同时,旨在减少模型计算开销、加快推理速度,具有显著的实用价值和应用前景。
技术关键词
全景分割方法
视觉特征提取
路由器
文本编码器
多尺度特征提取
语义
注意力
解码器
对象
感知特征
动态
参数
前馈神经网络
金字塔结构
融合视觉
双线性插值
系统为您推荐了相关专利信息
人脸表情识别系统
特征提取网络
人脸表情识别方法
路由器
特征提取模块
农业大数据模型
可视化分析方法
可视化界面
深度学习架构
多尺度特征提取
图像编辑技术
多模态融合机制
图像特征向量
图像特征提取
生成高质量图像
多尺度特征融合
锂电池
重型卡车
多尺度特征提取
融合特征
端口检测方法
机顶盒电路板
视觉特征提取
端口检测系统
机顶盒型号