摘要
本发明公开一种面向复杂开放场景的三维语义分割方法,其包括预训练阶段和推理阶段,在预训练阶段包括以下步骤:在预训练阶段,采集原始场景中的物体点云、文本词汇、二维图像以及场景点云,从物体点云、文本词汇、二维图像以及三维场景点云中提取特征;在多模态数据特征之间进行对齐,并通过对比学习进行知识蒸馏获得鲁棒的三维特征表达器;在推理阶段包括以下步骤:对“提示”和三维场景点云进行特征提取;将三维场景点云特征与提示特征进行相似度计算,相似度值大于设定阈值的三维点即为选定区域。本发明以物体点云、文本词汇、二维图像作为提示,从复杂三维场景中分割出对应区域,同时还具备对整个三维场景进行闭集语义分割的能力。
技术关键词
三维语义分割方法
点云特征提取
三维特征提取
场景
图像语义分割模型
文本编码器
特征提取器
物体特征提取
阶段
图像像素
模型预训练
相机旋转
样本
点云模型
系统为您推荐了相关专利信息
场景搜索方法
基因遗传算法
复杂度
自动驾驶系统
测试场景
库岸边坡
可视化系统
三维场景信息
数据分析模块
变形监测数据
信号恢复方法
噪声
信号恢复装置
战场环境
通信设备
燃煤机组
不确定性模型
协同优化方法
调峰需求
新能源电站