一种基于三维高斯场景的开放词汇语义分割方法及装置

正文

推荐专利

申请号：CN202410837317

申请日期：2024-06-26

公开号：CN118887665A

公开日期：2024-11-01

类型：发明专利

摘要

本发明公开了一种基于三维高斯场景的开放词汇语义分割方法及装置，涉及计算机视觉技术领域。首先训练不含有语义信息的三维高斯场景，然后对数据集的图片进行预处理，提取出语义特征图；然后利用语义特征图，在三维高斯场景中训练场景的开放词汇语义特征，输出每一个视角下的图片对应的预测特征图；训练完成后，将语义分割视作二分类，引入可优化的语义空间超平面，利用RES模型的预测结果来微调可优化的语义空间超平面，输出语义分割结果。本发明提供的一种基于三维高斯场景的开放词汇语义分割方法及装置，提出可优化的语义空间超平面方法，不需要基于经验设定的像素—文本相似度的阈值，又能实现相似度阈值的动态调整与更精确的分割效果。

技术关键词

语义特征预测特征语义分割方法视角文本编码器 Sigmoid函数像素训练场景聚类解码器自然语言图片超参数相机计算机视觉技术度函数样本

系统为您推荐了相关专利信息

一种基于文本的推荐方法、装置、设备及存储介质

语义意图交叉注意力机制辅助编码器样本文本编码器

基于航迹预训练大模型的航迹应用推理方法及系统

航迹数据推理方法语义特征构建代价函数样本

农机导航纠偏方法、装置、农机

纠偏方法视觉偏差特征点农机导航技术

一种基于机器学习的大屏幕显示系统

显示控制模块机器学习模型环境光视角数据收集单元

语音生成方法、装置、设备、存储介质及产品

声学特征语音生成模型训练场景生成语音预测特征

一种基于三维高斯场景的开放词汇语义分割方法及装置

站点导航

APP 下载