摘要
本申请实施例提供了一种图像描述方法和装置、电子设备及存储介质,属于人工智能及金融技术领域。该方法包括:获取原始图像数据和原始图像指示信息;对原始图像指示信息进行扩写处理,得到初始图像指示信息;对原始图像数据进行图像特征提取,得到图像嵌入特征;对初始图像指示信息进行文本特征提取,得到文本嵌入特征;将图像嵌入特征和文本嵌入特征进行特征融合,得到目标信息嵌入特征;根据目标信息嵌入特征对原始图像数据进行图像描述,得到目标图像描述信息。本申请实施例能够充分利用图像数据与图像指示信息的互补性,提高了图像描述的准确性。
技术关键词
嵌入特征
原始图像数据
图像嵌入
图像特征提取
文本
矩阵
注意力
图像编码
图文
电子设备
可读存储介质
分词
特征提取模块
数据获取模块
图像增强
图像分割
处理器