摘要
实施例确定现实世界对象的语义分割。一个此类实施例获得现实世界对象的图像。使用多个视觉变换器(ViT)模型处理所获得的图像以生成多个分割掩码。每一ViT模型被配置成输出对应于相应目标材料的相应分割掩码。使用神经网络组合器模型,基于所述多个分割掩码来生成多相语义分割掩码。训练所述神经网络组合器模型以集成所述多个ViT模型的输出。由此确定所述现实世界对象的语义分割。
技术关键词
现实世界对象
组合器
语义
图像
变换器
计算机程序产品
生成式对抗网络
感兴趣
度量
视觉
线性单元
处理器
批量
数据
指令
速率
存储器
解码器
粘结剂