摘要
本申请提出的图文生成方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域。该方法包括:获取目标图像,并对目标图像进行图像编码,得到目标图像特征;获取目标文案,并对目标文案进行文本编码,得到目标文案特征;对目标图像特征和目标文案特征进行特征融合,得到图文融合特征;对图文融合特征进行卷积注意力预测,得到文案布局描述文本;将文案布局描述文本和目标文案进行编码,得到文案布局特征;对文案布局特征和目标图像特征进行分割编码,得到图文布局编码特征;对文案布局特征和图文布局编码特征进行分割解码,得到目标图文。本申请能够降低图像的复杂背景带来的不良影响,提高图文生成准确性。
技术关键词
布局特征
图文
编码特征
融合特征
注意力
文本
样本
图像编码
感知特征
生成方法
编码模块
噪声
图像修复模型
卷积特征
解码
电子设备
网络
系统为您推荐了相关专利信息
智能广告投放
动态知识图谱
决策方法
广告特征
深度学习网络
关键信息检测方法
多尺度特征
融合特征
单据
贸易
代码漏洞检测方法
数据流特征
融合特征
风险评估模型
节点