摘要
一种图像标题生成方法、系统、设备及介质,包括:基于待生成标题的图像利用卷积神经网络提取图像特征并进行平均池化处理,得到平均池化图像特征集;基于平均池化图像特征集按照时间步顺序依次利用预先构建的时序回顾视觉保留模型进行计算,得到各单词并生成标题;利用注意力波动监督模型对所述标题进行优化,得到优化后的图像标题;本申请提出的时序回顾视觉保留模型考虑了之前所有时刻的可视化上下文,解决了背离人的注意力机制这一问题;注意力波动监督模型增强了视觉信息在强化学习中的影响,能够在计算强化学习奖励时考虑到图片的特征。
技术关键词
强化学习算法
图像特征集
视觉
生成方法
参数
强化学习方法
时序
信号
矩阵
图像特征提取
模块
注意力机制
生成系统
计算机设备
可读存储介质
方程
存储器
系统为您推荐了相关专利信息
机器人基坐标系
振镜
位置标定方法
焊点
位置标定系统
气体泄漏检测系统
智能校准方法
运动伪影消除
温度漂移补偿
多模态数据融合
车载充电器
性能测试方法
模式特征向量
指令
生成结构
识别判定方法
轨迹模型
动火作业
光学图像数据
红外热成像设备