摘要
本申请实施例提供点云网络训练方法、点云数据处理方法及装置,涉及无人驾驶与智能交通技术领域。该方法利用点云网络得到激光雷达点云数据的三维点云特征,利用图像编码器得到多视角图像的二维图像特征,利用视觉基础模型对多视角图像进行掩码划分得到多个对象区域,利用文本编码器生成每个对象区域对应的文本特征,根据文本特征、每个对象区域对应的二维区域像素特征和三维区域点云特征进行图像‑文本‑点云对比学习,生成语义区域对比损失值,对点云网络进行训练。使用多模态数据联合训练,利用区域级文本特征实现细粒度的跨模态特征对齐,基于图像‑文本‑点云的自监督对比学习框架增强点云网络的表征能力,提高下游三维点云理解的精度。
技术关键词
网络训练方法
二维图像特征
点云特征
激光雷达点云数据
文本编码器
对象
像素
图像编码器
训练系统
点云数据处理方法
多视角
语义
样本
网络训练装置
视觉
系统为您推荐了相关专利信息
融合特征
重建点云
深度卷积神经网络
激光雷达点云压缩
三维激光雷达点云
多头注意力机制
学习方法
文本编码器
图像编码器
多模态
激光雷达点云数据
定位方法
深度优先搜索
机器人位姿
里程计
滤波
人脸识别模型
分量特征
小波变换处理
人脸识别模块