摘要
本申请提供一种文本生成方法、装置及相关设备,涉及人工智能的技术领域,所述方法包括:对待预测图像进行编码,得到图像特征;根据所述图像特征对关联所述待预测图像的非图像特征进行计算,得到第一注意力信息,以及根据所述非图像特征对所述图像特征进行计算,得到第二注意力信息,所述非图像特征用于表示所述待预测图像的上下文语境;对所述第一注意力信息和所述第二注意力信息进行融合,得到目标注意力信息;对所述目标注意力信息进行解码,得到预测文本。本申请通过图像特征和用于描述图像上下文语境的非图像特征的双向交互,可获得更加准确的注意力信息,进而得以输出贴合待预测图像的图像内容的预测文本。
技术关键词
视觉特征
图像
文本生成方法
语义特征
语义注意力
解码器
文本生成装置
数据
处理器
可读存储介质
计算机程序产品
音频特征
注意力机制
解码模块
编码模块
系统为您推荐了相关专利信息
视觉采集装置
图像检测系统
PLC控制器
工控机
卷烟
甲状腺超声图像
医学图像处理方法
图像处理模型
轮廓区域
医学图像处理装置
文本特征向量
图像特征向量
知识点标注方法
知识点标签
特征提取网络
病虫害
多模态特征融合
融合特征
烟叶图像
农业设备