多视角人像生成方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202510463298

申请日期：2025-04-14

公开号：CN120495465A

公开日期：2025-08-15

类型：发明专利

摘要

本申请涉及一种多视角人像生成方法、装置、计算机设备和存储介质。多视角人像生成方法包括：获取用户输入的用于多视角人像生成的初始文本；将初始文本输入至文本生成模型中进行文本内容扩增处理，得到扩增后文本；扩增后文本包括肖像文本；将扩增后文本输入至人物肖像生成模型中进行人物肖像生成，得到初始人像；将初始文本、扩增后文本和初始人像输入至多模态大语言模型中，通过多模态大语言模型生成视角要求文本、服饰文本、人物姿态文本和场景文本；与初始人像一起输入至多视角人像生成模型中进行图像生成，得到初始人像在多个不同视角下的完整图像。采用本方法能够提高了生成结果的可控性与图像质量。

技术关键词

人像生成方法多视角大语言模型文本生成模型服饰文本输入界面姿态控制模块输入区计算机设备注意力机制多模态图像生成模型花纹场景纹理面部计算机程序产品

系统为您推荐了相关专利信息

一种基于知识图谱和检索增强的政务问答方法及系统

政务答案多模态信息大语言模型文本

一种企业知识库智能文档查询方法和系统

企业知识库智能文档大语言模型生成提示词生成文档

一种基于大语言模型的代码驱动具身智能体的后门攻击链方法

后门大语言模型视觉触发器生成对抗网络有效性

大语言模型越狱攻击的防御方法、系统、设备和存储介质

大语言模型解码器特征提取模块基准探针

一种多模态数据集的构建方法及系统

大语言模型离线光学字符识别技术分析用户需求文本

多视角人像生成方法、装置、计算机设备和存储介质

站点导航

APP 下载