视觉语言融合的无人机航拍图像开放词汇语义分割方法

正文

推荐专利

申请号：CN202510470102

申请日期：2025-04-15

公开号：CN120014280B

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种视觉语言融合的无人机航拍图像开放词汇语义分割方法，其涉及多模态人工智能技术领域。本方法基于多种注意力机制、多层次融合模块、动态调整机制，构建了视觉语言融合分割模型，确保了复杂场景下对已知与未知类别的航拍图像实现高精度、鲁棒性的分割效果；利用VIT、Mamba模型提取全局图像信息、局部图像细节，并采用自适应加权融合实现全局与局部特征的动态平衡，使用可变形卷积对局部结构进行强化，保证整体场景语义的准确表达；利用异构跨模态图融合模型整合更远距离的跨模态语义关系，不断融合来自视觉、文本以及领域知识的多维信息。

技术关键词

无人机航拍图像语义分割方法训练特征语义分割模型三元组损失函数视觉特征提取跨模态解码模块特征提取模型注意力机制多尺度异构全局特征提取文本多层次节点

系统为您推荐了相关专利信息

基于改进视觉特征提取与匹配优化的强鲁棒性SLAM方法及系统

SLAM方法视觉特征提取分层特征鲁棒性多尺度特征融合

一种基于协议字段向量相似度的工业控制系统异常检测方法

工业控制系统三元组损失函数字段工控协议样本

一种基于定向描述与多特征约束的点云配准方法

关键点三元组损失函数矩阵点云数学模型

一种基于检索增强语言模型的法律智能问答方法

智能问答方法门控循环神经网络门控循环单元三元组损失函数排序损失

一种基于Mamba的图像语义分割方法和系统

图像语义分割方法特征提取模块通道上采样状态空间模型

视觉语言融合的无人机航拍图像开放词汇语义分割方法

站点导航

APP 下载