摘要
本发明公开了一种基于视角特定提示词的三维点云识别方法及相关设备,其中方法包括:获取点云数据,通过多个预设视角对点云进行投影,获得多视角图像;将多视角图像输入对比语言‑图像预训练图像编码器,获得多视图特征;从预设的多源视角特定提示词库中获取视角特定提示词,其中每个视角和一组视角特定提示词对应;将视角特定提示词输入对比语言‑图像预训练文本编码器,获得文本特征;根据多视图特征和文本特征进行相似度计算,根据计算的相似度获取识别结果。本发明通过将点云投影为多视角图像,保留几何信息;为每个视角分配专用提示词,将点云多视角特征与多视角语义特征进行相似度计算,实现零样本或少样本条件下的高精度识别。
技术关键词
三维点云识别方法
文本编码器
图像编码器
多视角
轻量级神经网络
计算机程序产品
物体
预训练模型
大语言模型
指令
贪婪算法
轮廓特征
处理器
生成方式
指标
数据
系统为您推荐了相关专利信息
物体检测方法
预训练模型
标签
文本编码器
图像编码器
无人机遥感技术
测绘方法
三维点云重建
无人机多光谱影像
稠密点云
条件可控
图像生成方法
遥感图像处理
数据
特征提取网络
轻量级神经网络
相位解缠方法
模块
输入端
相位解缠技术