摘要
本公开涉及一种视觉内容生成方法、装置及电子设备;视觉内容生成方法,包括:获取原始视觉内容和用于生成所述原始视觉内容的原始提示文本;通过预训练的多模态模型,根据所述原始视觉内容,确定第一反向文本,所述第一反向文本用于描述所述原始视觉内容;根据所述第一反向文本,对所述原始提示文本进行重构,得到重构提示文本;通过预训练的扩散模型,根据所述重构提示文本,生成目标视觉内容。该视觉内容生成方法、装置及电子设备可以提高视觉内容生成的质量。
技术关键词
内容生成方法
文本
视觉
语义
内容生成装置
电子设备
实体
重构模块
关系
存储器
偏差
风险
冗余
处理器
频率
系统为您推荐了相关专利信息
数据生成方法
数据生成程序
校验程序
标签
程序生成模块
自然语言
构建知识图谱
三元组
双向长短期记忆网络
语义