摘要
本发明公开了图文内容匹配生成系统、方法及存储介质,属于电数据处理技术领域,解决了现有方法无法准确识别多模态的自然输入信息并深入提取多模态输入中的复杂特征,导致其对用户意图的理解不够准确的问题,方法包括基于预训练的文本识别模型对自然输入信息识别分析,得到文本输出向量,采用多模型投票算法改进的生成对抗网络模型确定最优匹配集,图文生成器基于贪心策略对文本输出向量、最优匹配集进行排版重建;本发明能够保证准确识别多模态的自然输入信息的同时提取用户的情感特征、偏好特征,保证精准理解用户意图和偏好,并能够更全面地捕捉文本和图像之间的语义关联,优化了图文的布局效果,从而生成更高质量的排版生成结果。
技术关键词
文本识别模型
生成对抗网络模型
投票算法
图文
图片
生成方法
多模型
贪心策略
排版
实体
偏好特征
DBSCAN算法
情感特征
生成系统
上下文语义信息
Kruskal算法
编码器
电数据处理技术
多模态
系统为您推荐了相关专利信息
虚拟场景数据
语音采集设备
交互方法
捕捉设备
指标
密钥加密系统
国密算法
监测运行状态
生成对抗网络模型
检测异常状态