摘要
本申请涉及一种多视角人像生成方法、装置、计算机设备和存储介质。多视角人像生成方法包括:获取用户输入的用于多视角人像生成的初始文本;将初始文本输入至文本生成模型中进行文本内容扩增处理,得到扩增后文本;扩增后文本包括肖像文本;将扩增后文本输入至人物肖像生成模型中进行人物肖像生成,得到初始人像;将初始文本、扩增后文本和初始人像输入至多模态大语言模型中,通过多模态大语言模型生成视角要求文本、服饰文本、人物姿态文本和场景文本;与初始人像一起输入至多视角人像生成模型中进行图像生成,得到初始人像在多个不同视角下的完整图像。采用本方法能够提高了生成结果的可控性与图像质量。
技术关键词
人像生成方法
多视角
大语言模型
文本生成模型
服饰
文本输入界面
姿态控制模块
输入区
计算机设备
注意力机制
多模态
图像生成模型
花纹
场景
纹理
面部
计算机程序产品
系统为您推荐了相关专利信息
企业知识库
智能文档
大语言模型
生成提示词
生成文档
后门
大语言模型
视觉触发器
生成对抗网络
有效性
大语言模型
离线
光学字符识别技术
分析用户需求
文本