一种基于增强注意力机制的端到端图像描述生成方法

AITNT
正文
推荐专利
一种基于增强注意力机制的端到端图像描述生成方法
申请号:CN202410807697
申请日期:2024-06-21
公开号:CN118736575A
公开日期:2024-10-01
类型:发明专利
摘要
本发明提出一种基于增强注意力机制的端到端图像描述生成方法,属于人工智能技术领域。生成图像描述生成模型,包括图像特征抽取层、多粒度特征融合编码器、自适应双向解图码器、线性变换层和打分排序层;对图像描述生成模型使用交叉熵损失进行训练,然后采用自我批评训练优化CIDEr评分优化,并利用完成训练的图像描述生成模型描述图像。其评价指标上超越了现有技术,本发明的图像描述方法不仅提高了图像语义理解能力,而且更贴近人类描述习惯,具有良好的可解释性。
技术关键词
多粒度特征 生成方法 图像 交叉注意力机制 语句 图片 解码器 编码器 表达式 细粒度特征 抽取特征 阶段 解码信息 卷积神经网络提取 文本生成器 模块
系统为您推荐了相关专利信息
1
水体监测装置
成像装置 对象 主板 AI算法 偏振滤光器
2
基于深度学习的镜片瑕疵检测方法及其相关设备
瑕疵检测方法 缺陷特征提取 置信度阈值 视觉算法 镜片瑕疵检测装置
3
一种基于多模光纤模式调制的计算成像方法及系统
多模光纤 散斑图像 优化网络架构 成像方法 图像传输系统
4
特写空境镜头的识别方法、装置、存储介质以及电子设备
镜头 图像 识别方法 数据 识别模块
5
一种基于LiDAR点云的城市绿视率评估方法
视野 植被 图像 环境评估技术 语义分割技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号