一种基于图文特征融合的图像描述系统及方法

AITNT
正文
推荐专利
一种基于图文特征融合的图像描述系统及方法
申请号:CN202411075186
申请日期:2024-08-07
公开号:CN119006964A
公开日期:2024-11-22
类型:发明专利
摘要
本发明公开了一种基于图文特征融合的图像描述系统及方法,系统包括:文本特征提取模块、特征提取模块、图像编码器模块、特征融合模块和解码器模块;文本特征提取模块利用词嵌入方式将原始图像的文本映射为向量,得到原始文本特征;特征提取模块用于对原始图像进行特征提取,得到原始图像的网格特征和全局特征;图像编码器模块利用注意力机制对网格特征和全局特征进行注意力交互;特征融合模块用于将注意力交互后的网格特征和全局特征进行融合增强,得到增强后图像特征;解码器模块基于原始文本特征、全局特征和增强后图像特征进行融合,得到图像描述语句。本发明结合了图像和文本信息,利用先进的深度学习技术,实现了对图像内容的准确描述。
技术关键词
特征提取模块 图像编码器 图文 语义特征 网格特征提取 文本 注意力机制 全局平均池化 解码器 滑动窗口 语句 深度学习技术 层级 通道 动态
系统为您推荐了相关专利信息
1
一种基于深度学习的课堂信息化评价管理系统
评价管理系统 学生学习状态 关联特征数据 指数 指标
2
一种直流矿热炉二次母线电流缺失值填补方法
缺失值填补方法 直流矿热炉 状态空间模型 母线 特征提取模块
3
一种行人目标检测方法、装置、介质和设备
噪声图像 可见光图像 纹理特征 语义特征 分支
4
一种遥感图像变化检测方法及相关设备
融合特征 遥感图像变化检测 特征提取模块 遥感图像数据 结构轮廓
5
航空轮胎三维形貌演化驱动的剩余寿命动态预测方法及系统
轮胎 动态预测方法 工况 动态预测系统 指数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号