摘要
本发明提供了一种图像标注方法,包括:通过深度相机采集物体的RGB图像和深度图像,并进行预处理;将处理后的深度图像转换为点云数据并配准至对应的RGB图像像素;构建多维度置信度评估模型,融合空间距离、深度方差与时序稳定性特征计算点云数据置信度;为所述物体的二维图像进行标注,得到包含物体空间位置信息的二维提示词。根据本发明实施例提供的技术方案,解决了视觉语言模型在三维位置识别与理解方面的缺陷,使视觉语言模型能够准确感知复杂场景中物体的距离及其空间关系,显著提升智能机器人在装配操作、目标抓取等任务中的三维空间理解与决策能力。
技术关键词
图像分割
图像标注方法
深度相机
坐标系
物体
噪声数据
图像像素
坐标位置信息
三维位置信息
机器人基座
像素点
直方图
近邻算法
均衡算法
智能机器人
位置识别
协方差矩阵
系统为您推荐了相关专利信息
气流角估计方法
协方差矩阵
固定翼飞行器
卡尔曼滤波算法
状态更新
历史数据分析方法
多轴曲线图
压缩算法
动态可视化
多节点
无人机导航方法
环境图像数据
避障距离
无人机导航技术
结点
时间偏移量
图像拼接
相机图像数据
处理器
子模块
视觉惯性里程计
激光点云数据
IMU坐标系
相机
特征值