摘要
本申请提供了一种图像生成方法及装置。该方法包括:获取待生成目标图像的参考图像和文本描述;提取文本描述的文本特征,以及提取参考图像的风格特征和图像特征;基于文本特征从模型库中确定出多个文生图模型,得到第一集合;基于风格特征和图像特征从模型库中确定出多个文生图模型,得到第二集合;融合第一集合和第二集合,得到第三集合;从文本提示评分库中确定与文本描述最相似的目标文本提示词,并从第三集合中的多个文生图模型中确定出使用目标文本提示词评分最高的模型,得到目标文生图模型;依据参考图像和文本描述,利用目标文生图模型生成目标图像。采用上述技术手段,可以解决现有技术中,无法根据输入选择最合适的文生图模型,导致生成图像质量差的问题,进而提高生成图像质量。
技术关键词
文本
模型库
广度优先搜索
图像生成方法
风格
图像生成装置
可读存储介质
场景
处理器
模块
存储器
计算机
电子设备
系统为您推荐了相关专利信息
视觉感知特征
机器人控制方法
节点
机器人控制系统
语义图谱
期货交易系统
双向长短期记忆网络
倒排索引方法
异常检测方法
指令
情绪识别方法
多模态特征
情绪识别装置
数据
计算机程序指令