基于视觉大模型的全场景地物分割的处理方法及系统

AITNT
正文
推荐专利
基于视觉大模型的全场景地物分割的处理方法及系统
申请号:CN202411725983
申请日期:2024-11-28
公开号:CN119693823A
公开日期:2025-03-25
类型:发明专利
摘要
本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统,属于计算机视觉技术领域。包括以下步骤:获取无人机拍摄的视频数据,对视频中图像数据进行预处理;通过预设信息,使用Grounding DINO检测图像数据中的类别,使用SAM分割模型获取检测到的框的实例分段掩码;使用CLIPSeg获取类别的一次分割掩码;在一次割掩码中确定采样点,并将采样点输入至SAM分割模型以获得类别的二次分割掩码;将一次分割掩码与二次分割掩码结合,得到全景分割结果。相较于现有技术,本发明的有益之处在于,解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力,实现了根据提示词进行无人机视角图片的全场景分割。
技术关键词
采样点 场景 计算机可执行指令 无人机拍摄视频 语义分析能力 图像校正 计算机视觉技术 数据 文本识别 处理器 分段 关键帧 可读存储介质 存储器 对比度
系统为您推荐了相关专利信息
1
一种基于多源遥感及空间加权的耕地土壤pH估算方法
耕地土壤 随机森林模型 空间权重矩阵 采样点 后向散射系数
2
一种低空气象探测多无人机分布式编队控制方法
模拟退火算法 进化优化算法 分布式编队 多无人机 一致性算法
3
一种分布式声学传感监测数据处理分析方法
数据处理模块 分析方法 监测需求 模块化功能模块 监测数据处理技术
4
一种基于ROS的移动机械臂扫描方法及系统
移动机械臂 移动机器人底座 扫描方法 坐标系 移动机器人导航
5
一种适用于复杂井下环境的A*-RRT算法机器人路径规划方法
RRT算法 障碍物 节点 多面体 终点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号