基于视觉大模型的目标对象分割方法

AITNT
正文
推荐专利
基于视觉大模型的目标对象分割方法
申请号:CN202410956779
申请日期:2024-07-17
公开号:CN118918124A
公开日期:2024-11-08
类型:发明专利
摘要
本公开提供了一种基于视觉大模型的目标对象分割方法、装置、电子设备、存储介质及程序产品。本公开的目标对象分割方法,包括:获取目标场景的相机坐标系下的三维点云和图像坐标系下的二维图像;对三维点云进行分块处理,获得至少一个点云块;对点云块进行主成分分析,获取点云块的主方向,获得点云块的有向包围盒;基于相机坐标系和图像坐标系的变换关系将有向包围盒投影至二维图像所在平面,获得目标对象的二维包围框并作为包围框提示;判断有向包围盒中目标对象的数量是否为一个;如果有向包围盒中目标对象的数量为一个,执行以下过程:将包围框提示输入至视觉大模型,使视觉大模型基于包围框提示对二维图像进行目标对象分割,获得分割结果。
技术关键词
对象分割方法 掩膜边框 对象检测 视觉 坐标系 图像分割算法 多模态 相机 采样点 图像模板 点云 标记 成分分析 掩模 承载体 处理器 可读存储介质
系统为您推荐了相关专利信息
1
基于视觉的飞行电力巡检机器人电力线分割方法及系统
电力巡检机器人 滑动窗口 分割方法 数据传输模块 像素点
2
基于位置的音频处理
音频再现装置 计算机 参数 数据标签 扬声器组件
3
一种基于引导向量场的无人农机动态避障方法、系统和装置
无人农机 动态避障方法 避障控制器 干扰观测器 非光滑
4
机器人自主避障方法、装置、避障机器人及产品
激光点云数据 障碍物识别 避障机器人 导航坐标系 滤波
5
无障碍的客服服务方法、装置、设备及计算机程序产品
视觉障碍用户 语音引导信息 界面 客服服务方法 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号