摘要
本申请属于人工智能技术领域,涉及一种图像生成方法,包括:获取用户输入的文本描述;基于预训练的语言模型将文本描述转换为语义向量;基于预训练的姿势预测器对文本描述进行姿势估计处理得到初始姿势参数;基于预设的生物力学约束模块与姿势条件扩散模块对初始姿势参数进行参数优化得到目标姿势参数;将目标姿势参数转换为对应的姿势热图;基于预设的图像生成器对语义向量与姿势热图进行处理得到目标图像;对目标图像进行输出处理。本申请还提供一种图像生成装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,目标图像可存储于区块链中。本申请可应用于金融领域和医疗领域中的文生图场景,本申请提高了生成图像的准确性与可靠性。
技术关键词
图像生成方法
姿势
语义向量
图像生成器
计算机可读指令
参数
图像生成装置
文本
计算机设备
融合策略
功能模块
可读存储介质
人工智能技术
物理
区块链技术
超分辨率
处理器
输出模块