摘要
本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统,属于计算机视觉技术领域。包括以下步骤:获取无人机拍摄的视频数据,对视频中图像数据进行预处理;通过预设信息,使用Grounding DINO检测图像数据中的类别,使用SAM分割模型获取检测到的框的实例分段掩码;使用CLIPSeg获取类别的一次分割掩码;在一次割掩码中确定采样点,并将采样点输入至SAM分割模型以获得类别的二次分割掩码;将一次分割掩码与二次分割掩码结合,得到全景分割结果。相较于现有技术,本发明的有益之处在于,解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力,实现了根据提示词进行无人机视角图片的全场景分割。
技术关键词
采样点
场景
计算机可执行指令
无人机拍摄视频
语义分析能力
图像校正
计算机视觉技术
数据
文本识别
处理器
分段
关键帧
可读存储介质
存储器
对比度
系统为您推荐了相关专利信息
耕地土壤
随机森林模型
空间权重矩阵
采样点
后向散射系数
模拟退火算法
进化优化算法
分布式编队
多无人机
一致性算法
数据处理模块
分析方法
监测需求
模块化功能模块
监测数据处理技术
移动机械臂
移动机器人底座
扫描方法
坐标系
移动机器人导航