基于视觉大模型的全场景地物分割的处理方法及系统

正文

推荐专利

申请号：CN202411725983

申请日期：2024-11-28

公开号：CN119693823A

公开日期：2025-03-25

类型：发明专利

摘要

本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统，属于计算机视觉技术领域。包括以下步骤：获取无人机拍摄的视频数据，对视频中图像数据进行预处理；通过预设信息，使用Grounding DINO检测图像数据中的类别，使用SAM分割模型获取检测到的框的实例分段掩码；使用CLIPSeg获取类别的一次分割掩码；在一次割掩码中确定采样点，并将采样点输入至SAM分割模型以获得类别的二次分割掩码；将一次分割掩码与二次分割掩码结合，得到全景分割结果。相较于现有技术，本发明的有益之处在于，解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力，实现了根据提示词进行无人机视角图片的全场景分割。

技术关键词

采样点场景计算机可执行指令无人机拍摄视频语义分析能力图像校正计算机视觉技术数据文本识别处理器分段关键帧可读存储介质存储器对比度

系统为您推荐了相关专利信息

一种基于多源遥感及空间加权的耕地土壤pH估算方法

耕地土壤随机森林模型空间权重矩阵采样点后向散射系数

一种低空气象探测多无人机分布式编队控制方法

模拟退火算法进化优化算法分布式编队多无人机一致性算法

一种分布式声学传感监测数据处理分析方法

数据处理模块分析方法监测需求模块化功能模块监测数据处理技术

一种基于ROS的移动机械臂扫描方法及系统

移动机械臂移动机器人底座扫描方法坐标系移动机器人导航

一种适用于复杂井下环境的A*-RRT算法机器人路径规划方法

RRT算法障碍物节点多面体终点

基于视觉大模型的全场景地物分割的处理方法及系统

站点导航

APP 下载