一种基于三维高斯场景的开放词汇语义分割方法及装置

AITNT
正文
推荐专利
一种基于三维高斯场景的开放词汇语义分割方法及装置
申请号:CN202410837317
申请日期:2024-06-26
公开号:CN118887665A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于三维高斯场景的开放词汇语义分割方法及装置,涉及计算机视觉技术领域。首先训练不含有语义信息的三维高斯场景,然后对数据集的图片进行预处理,提取出语义特征图;然后利用语义特征图,在三维高斯场景中训练场景的开放词汇语义特征,输出每一个视角下的图片对应的预测特征图;训练完成后,将语义分割视作二分类,引入可优化的语义空间超平面,利用RES模型的预测结果来微调可优化的语义空间超平面,输出语义分割结果。本发明提供的一种基于三维高斯场景的开放词汇语义分割方法及装置,提出可优化的语义空间超平面方法,不需要基于经验设定的像素—文本相似度的阈值,又能实现相似度阈值的动态调整与更精确的分割效果。
技术关键词
语义特征 预测特征 语义分割方法 视角 文本编码器 Sigmoid函数 像素 训练场景 聚类 解码器 自然语言 图片 超参数 相机 计算机视觉技术 度函数 样本
系统为您推荐了相关专利信息
1
一种基于文本的推荐方法、装置、设备及存储介质
语义意图 交叉注意力机制 辅助编码器 样本 文本编码器
2
基于航迹预训练大模型的航迹应用推理方法及系统
航迹数据 推理方法 语义特征 构建代价函数 样本
3
农机导航纠偏方法、装置、农机
纠偏方法 视觉 偏差 特征点 农机导航技术
4
一种基于机器学习的大屏幕显示系统
显示控制模块 机器学习模型 环境光 视角 数据收集单元
5
语音生成方法、装置、设备、存储介质及产品
声学特征 语音生成模型 训练场景 生成语音 预测特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号