视觉语言融合的无人机航拍图像开放词汇语义分割方法

AITNT
正文
推荐专利
视觉语言融合的无人机航拍图像开放词汇语义分割方法
申请号:CN202510470102
申请日期:2025-04-15
公开号:CN120014280B
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种视觉语言融合的无人机航拍图像开放词汇语义分割方法,其涉及多模态人工智能技术领域。本方法基于多种注意力机制、多层次融合模块、动态调整机制,构建了视觉语言融合分割模型,确保了复杂场景下对已知与未知类别的航拍图像实现高精度、鲁棒性的分割效果;利用VIT、Mamba模型提取全局图像信息、局部图像细节,并采用自适应加权融合实现全局与局部特征的动态平衡,使用可变形卷积对局部结构进行强化,保证整体场景语义的准确表达;利用异构跨模态图融合模型整合更远距离的跨模态语义关系,不断融合来自视觉、文本以及领域知识的多维信息。
技术关键词
无人机航拍图像 语义分割方法 训练特征 语义分割模型 三元组损失函数 视觉特征提取 跨模态 解码模块 特征提取模型 注意力机制 多尺度 异构 全局特征提取 文本 多层次 节点
系统为您推荐了相关专利信息
1
基于改进视觉特征提取与匹配优化的强鲁棒性SLAM方法及系统
SLAM方法 视觉特征提取 分层特征 鲁棒性 多尺度特征融合
2
一种基于协议字段向量相似度的工业控制系统异常检测方法
工业控制系统 三元组损失函数 字段 工控协议 样本
3
一种基于定向描述与多特征约束的点云配准方法
关键点 三元组损失函数 矩阵 点云 数学模型
4
一种基于检索增强语言模型的法律智能问答方法
智能问答方法 门控循环神经网络 门控循环单元 三元组损失函数 排序损失
5
一种基于Mamba的图像语义分割方法和系统
图像语义分割方法 特征提取模块 通道 上采样 状态空间模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号