摘要
本发明公开了一种基于双流特征融合的三维点云开放场景理解方法,属于多模态学习领域,包括数据准备,收集三维点云数据V,进行数据标注得到三维点云开放场景理解数据集A,将获得的三维点云开放场景理解数据集A进行数据集划分;构建三维点云开放场景监督信息,构建前景兴趣区和构建开放语义信息,融合双流特征信息;设计包含一个三维点云特征提取器E、预训练的文本特征提取器θtext与多模态判别器D的模型M;训练模型M得到模型M*;在模型M*上进行测试;本发明采用上述一种基于双流特征融合的三维点云开放场景理解方法,实现了在开集上的三维点云场景理解,显著提高了开集语义分割等任务的精度。
技术关键词
场景理解方法
三维点云数据
点云特征提取
文本
强化特征
特征提取器
语义
标签
图像
兴趣
编码向量
坐标系
多模态
相机
原型
跨模态
物体