摘要
本发明公开了一种基于跨模态空间超点的人车交互三维分割方法,包括以下步骤:步骤S1、文本特征编码器编码文本语言信息;步骤2、点云特征编码与超点生成;步骤3、超点几何特征融合;步骤4、分层特征匹配;步骤5、损失计算与训练。本发明的基于跨模态空间超点的人车交互三维分割方法,在人车交互与智能驾驶中,通过语言文本和点云的多模态融合,实现视觉特征信息与文本特征信息的匹配。通过文本和点云编码器经过归一化后统一特征尺度后输出具有语义和几何一致性的超点集合,分割并理解场景中的用户语言描述的对象,从而实现人车交互、智能导航、安全避障等。
技术关键词
三维分割方法
文本特征向量
跨模态
三维点云数据
网格特征
多层注意力机制
视觉特征信息
编码器
语义
融合特征
更新网络参数
注意力模型
人车交互
分层特征
点云特征
词特征
系统为您推荐了相关专利信息
乘员
身形特征
车辆座舱
多模态特征融合
面部特征
多模态交互系统
文本特征向量
子模块
显示终端
多模态交互方法
图像特征向量
图片版权保护方法
文本特征向量
随机噪声
保护图片内容