摘要
本发明提出一种基于增强注意力机制的端到端图像描述生成方法,属于人工智能技术领域。生成图像描述生成模型,包括图像特征抽取层、多粒度特征融合编码器、自适应双向解图码器、线性变换层和打分排序层;对图像描述生成模型使用交叉熵损失进行训练,然后采用自我批评训练优化CIDEr评分优化,并利用完成训练的图像描述生成模型描述图像。其评价指标上超越了现有技术,本发明的图像描述方法不仅提高了图像语义理解能力,而且更贴近人类描述习惯,具有良好的可解释性。
技术关键词
多粒度特征
生成方法
图像
交叉注意力机制
语句
图片
解码器
编码器
表达式
细粒度特征
抽取特征
阶段
解码信息
卷积神经网络提取
文本生成器
模块
系统为您推荐了相关专利信息
瑕疵检测方法
缺陷特征提取
置信度阈值
视觉算法
镜片瑕疵检测装置
多模光纤
散斑图像
优化网络架构
成像方法
图像传输系统