摘要
本申请公开了一种图像生成方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取多模态输入信息,多模态输入信息包括至少两种模态的输入信息;获取多模态输入信息的描述文本,描述文本是对多模态输入信息的信息内容进行描述的文本;获取描述文本对应的至少一个提示词,提示词用于指示所要生成图像的图像内容;从图像文本库中获取至少一个提示词分别对应的图像,提示词对应的图像用于图形化展示提示词所表示的文本内容;通过文生图模型根据至少一个提示词和至少一个提示词分别对应的图像,生成多模态输入信息对应的输出图像。本申请通过采用多模态输入信息,且采用提示词对应的图像来控制输出图像的生成,提高了图像生成的质量。
技术关键词
多模态
文本
图像生成方法
瑕疵
人物特征
计算机程序产品
图像生成装置
视频
音频
样本
计算机设备
图像获取模块
可读存储介质
机器学习模型
处理器
场景
格式化
存储器
系统为您推荐了相关专利信息
分析判断方法
多模态数据分析
频谱特征
空调通风管道
传感器单元
视频生成方法
动态信噪比
样本
视频生成技术
文本
开发测试方法
游戏引擎
分布式多智能体
多模态数据采集
智能体系统