基于内存增强和软掩膜的多波段图像自动描述方法

AITNT
正文
推荐专利
基于内存增强和软掩膜的多波段图像自动描述方法
申请号:CN202410822066
申请日期:2024-06-25
公开号:CN118736576A
公开日期:2024-10-01
类型:发明专利
摘要
本发明涉及图像描述方法和图像融合方法,尤其涉及多波段图像自动描述方法,具体为基于内存增强和软掩膜的多波段图像自动描述方法。将可见光图像特征、红外图像特征以及文本特征置于同一表征层级,在传统Transformer的基础上,构建内存增强模块用于存储多波段图像特征间的内在相关性以及语言上下文信息;同时,利用软掩膜机制筛选有效的视觉特征向量以及内存中存储的特征向量,以确保模型精确聚焦于关键视觉信息或语言上下文信息,可用于安防监控和军事侦察等复杂场景理解。
技术关键词
内存 红外图像特征 可见光图像 掩膜 多波段 多模态特征 关键视觉信息 图像融合方法 多头注意力机制 文本 解码器 阶段 输出特征 自然语言 指标 标记
系统为您推荐了相关专利信息
1
数据处理方法、装置、设备、存储介质及程序产品
数据存储区域 数据处理方法 数据处理系统 模块 处理器
2
基于铁电晶体管的全数字存内运算CMOS电路
铁电晶体管 铁电电容 电压 CMOS反相器 网络
3
一种动态场景下语义信息指导的红外/可见光融合全天时自主定位方法及系统
自主定位方法 可见光图像 动态场景 坐标系 特征点
4
AR实景导航方法、设备以及存储介质
语义分割模型 AR实景导航 实景导航方法 交通场景图像 卷积模块
5
一种基于实时资源反馈的线程动态调度与管理方法
多级反馈队列 硬件加速器 粒子群算法优化 动态调度算法 反馈调节机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号