一种基于增强注意力机制的端到端图像描述生成方法

正文

推荐专利

申请号：CN202410807697

申请日期：2024-06-21

公开号：CN118736575A

公开日期：2024-10-01

类型：发明专利

摘要

本发明提出一种基于增强注意力机制的端到端图像描述生成方法，属于人工智能技术领域。生成图像描述生成模型，包括图像特征抽取层、多粒度特征融合编码器、自适应双向解图码器、线性变换层和打分排序层；对图像描述生成模型使用交叉熵损失进行训练，然后采用自我批评训练优化CIDEr评分优化，并利用完成训练的图像描述生成模型描述图像。其评价指标上超越了现有技术，本发明的图像描述方法不仅提高了图像语义理解能力，而且更贴近人类描述习惯，具有良好的可解释性。

技术关键词

多粒度特征生成方法图像交叉注意力机制语句图片解码器编码器表达式细粒度特征抽取特征阶段解码信息卷积神经网络提取文本生成器模块

系统为您推荐了相关专利信息

水体监测装置

成像装置对象主板 AI算法偏振滤光器

基于深度学习的镜片瑕疵检测方法及其相关设备

瑕疵检测方法缺陷特征提取置信度阈值视觉算法镜片瑕疵检测装置

一种基于多模光纤模式调制的计算成像方法及系统

多模光纤散斑图像优化网络架构成像方法图像传输系统

特写空境镜头的识别方法、装置、存储介质以及电子设备

镜头图像识别方法数据识别模块

一种基于LiDAR点云的城市绿视率评估方法

视野植被图像环境评估技术语义分割技术

一种基于增强注意力机制的端到端图像描述生成方法

站点导航

APP 下载