基于视觉大模型的目标对象分割方法

正文

推荐专利

基于视觉大模型的目标对象分割方法

申请号：CN202410956779

申请日期：2024-07-17

公开号：CN118918124A

公开日期：2024-11-08

类型：发明专利

摘要

本公开提供了一种基于视觉大模型的目标对象分割方法、装置、电子设备、存储介质及程序产品。本公开的目标对象分割方法，包括：获取目标场景的相机坐标系下的三维点云和图像坐标系下的二维图像；对三维点云进行分块处理，获得至少一个点云块；对点云块进行主成分分析，获取点云块的主方向，获得点云块的有向包围盒；基于相机坐标系和图像坐标系的变换关系将有向包围盒投影至二维图像所在平面，获得目标对象的二维包围框并作为包围框提示；判断有向包围盒中目标对象的数量是否为一个；如果有向包围盒中目标对象的数量为一个，执行以下过程：将包围框提示输入至视觉大模型，使视觉大模型基于包围框提示对二维图像进行目标对象分割，获得分割结果。

技术关键词

对象分割方法掩膜边框对象检测视觉坐标系图像分割算法多模态相机采样点图像模板点云标记成分分析掩模承载体处理器可读存储介质

系统为您推荐了相关专利信息

基于视觉的飞行电力巡检机器人电力线分割方法及系统

电力巡检机器人滑动窗口分割方法数据传输模块像素点

基于位置的音频处理

音频再现装置计算机参数数据标签扬声器组件

一种基于引导向量场的无人农机动态避障方法、系统和装置

无人农机动态避障方法避障控制器干扰观测器非光滑

机器人自主避障方法、装置、避障机器人及产品

激光点云数据障碍物识别避障机器人导航坐标系滤波

无障碍的客服服务方法、装置、设备及计算机程序产品

视觉障碍用户语音引导信息界面客服服务方法计算机程序产品

基于视觉大模型的目标对象分割方法

站点导航

APP 下载