摘要
本发明公开了一种多模态特征嵌入的室内三维场景理解方法及终端,方法包括:获取二维图像以及预处理后的点云数据,并对所述二维图像以及所述预处理后的点云数据进行多模态特征提取;将提取到的多模态特征进行融合得到多模态融合特征,通过所述多模态融合特征优化多模态特征嵌入式室内三维场景理解模型;根据所述多模态特征嵌入式室内三维场景理解模型对所述预处理后的点云数据进行语义特征的提取,并输出语义分类优化结果;本发明提出新的基于Transformer的3D语义实例分割模型结合多模态特征进行室内三维场景理解的方法,提高室内三维场景理解的准确性和全面性。
技术关键词
室内三维场景
多模态特征
融合全局特征
实例分割模型
融合特征
语义特征
数据
预训练模型
文本生成模型
视觉特征提取
图像
深度图
可读存储介质
程序
自然语言
系统为您推荐了相关专利信息
临床检查数据
风险预测方法
呼吸系统
风险评估报告
多模态
分类模型构建方法
心脑血管疾病患者
矩阵
信号特征
疾病特征
医疗数据处理方法
医疗影像数据
医疗文本数据
融合特征
大数据
电子监控设备
安防模块
识别模块
云端
特征金字塔
离散小波变换
医学图像融合方法
特征提取模块
分支
重构