摘要
提供了用于开放式词汇全景分割的单级框架。一个方面提供了包括处理器和存储器的计算系统,存储器存储指令,指令在由处理器执行时,使处理器用于:接收图像;使用基于卷积神经网络的视觉语言模型,从图像中提取多个特征图;从多个特征图生成多个像素特征;从多个像素特征生成多个掩码预测;使用多个像素特征,生成与多个掩码预测相对应的多个词汇内类预测;使用多个特征图,生成多个词汇外类预测;在多个词汇内类预测和多个词汇外类预测上执行几何集成,以生成多个最终类预测;以及输出多个掩码预测和多个最终类预测。
技术关键词
像素
存储器存储指令
解码器
图像
预训练模型
视觉
文本编码器
处理器
执行全景
加权方法
媒体
分辨率
尺寸
对象
编辑
计算机
系统为您推荐了相关专利信息
车辆环境信息
天气预测模型
融合特征
策略控制方法
天气情况数据
融合神经网络
分类判别方法
图像低频分量
离散小波变换
裂缝
芯片
胶水
自动图像识别系统
LED支架
点胶工艺