摘要
本申请公开了一种图像生成方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取歌曲的基础信息;获取基础信息对应的至少一个目标词汇,目标词汇为描述歌曲的风格或内容的词汇;通过文生图模型根据至少一个目标词汇,生成至少一个目标词汇对应的目标图像;根据目标图像和歌曲的第一封面图像,得到融合图像,融合图像中包括目标图像中的主体和第一封面图像中的背景;通过图生图模型根据融合图像和第一封面图像,生成歌曲的第二封面图像。本申请通过对目标图像和歌曲的第一封面图像进行融合,实现了对第二封面图像中的主体的重新生成,提高了第二封面图像与歌曲的基础信息的关联性。
技术关键词
封面
图像生成方法
大语言模型
文本
风格
计算机程序产品
音频
基础
图像生成装置
生成歌曲
计算机设备
可读存储介质
多模态
标识
神经网络模型
处理器
模块
存储器