摘要
本公开提供了一种基于视觉大模型的目标对象分割方法、装置、电子设备、存储介质及程序产品。本公开的目标对象分割方法,包括:获取目标场景的相机坐标系下的三维点云和图像坐标系下的二维图像;对三维点云进行分块处理,获得至少一个点云块;对点云块进行主成分分析,获取点云块的主方向,获得点云块的有向包围盒;基于相机坐标系和图像坐标系的变换关系将有向包围盒投影至二维图像所在平面,获得目标对象的二维包围框并作为包围框提示;判断有向包围盒中目标对象的数量是否为一个;如果有向包围盒中目标对象的数量为一个,执行以下过程:将包围框提示输入至视觉大模型,使视觉大模型基于包围框提示对二维图像进行目标对象分割,获得分割结果。
技术关键词
对象分割方法
掩膜边框
对象检测
视觉
坐标系
图像分割算法
多模态
相机
采样点
图像模板
点云
标记
成分分析
掩模
承载体
处理器
可读存储介质
系统为您推荐了相关专利信息
电力巡检机器人
滑动窗口
分割方法
数据传输模块
像素点
无人农机
动态避障方法
避障控制器
干扰观测器
非光滑
激光点云数据
障碍物识别
避障机器人
导航坐标系
滤波
视觉障碍用户
语音引导信息
界面
客服服务方法
计算机程序产品