摘要
本发明公开了一种基于三维高斯场景的开放词汇语义分割方法及装置,涉及计算机视觉技术领域。首先训练不含有语义信息的三维高斯场景,然后对数据集的图片进行预处理,提取出语义特征图;然后利用语义特征图,在三维高斯场景中训练场景的开放词汇语义特征,输出每一个视角下的图片对应的预测特征图;训练完成后,将语义分割视作二分类,引入可优化的语义空间超平面,利用RES模型的预测结果来微调可优化的语义空间超平面,输出语义分割结果。本发明提供的一种基于三维高斯场景的开放词汇语义分割方法及装置,提出可优化的语义空间超平面方法,不需要基于经验设定的像素—文本相似度的阈值,又能实现相似度阈值的动态调整与更精确的分割效果。
技术关键词
语义特征
预测特征
语义分割方法
视角
文本编码器
Sigmoid函数
像素
训练场景
聚类
解码器
自然语言
图片
超参数
相机
计算机视觉技术
度函数
样本
系统为您推荐了相关专利信息
语义意图
交叉注意力机制
辅助编码器
样本
文本编码器
显示控制模块
机器学习模型
环境光
视角
数据收集单元
声学特征
语音生成模型
训练场景
生成语音
预测特征