多视角人像生成方法、装置、计算机设备和存储介质

AITNT
正文
推荐专利
多视角人像生成方法、装置、计算机设备和存储介质
申请号:CN202510463298
申请日期:2025-04-14
公开号:CN120495465A
公开日期:2025-08-15
类型:发明专利
摘要
本申请涉及一种多视角人像生成方法、装置、计算机设备和存储介质。多视角人像生成方法包括:获取用户输入的用于多视角人像生成的初始文本;将初始文本输入至文本生成模型中进行文本内容扩增处理,得到扩增后文本;扩增后文本包括肖像文本;将扩增后文本输入至人物肖像生成模型中进行人物肖像生成,得到初始人像;将初始文本、扩增后文本和初始人像输入至多模态大语言模型中,通过多模态大语言模型生成视角要求文本、服饰文本、人物姿态文本和场景文本;与初始人像一起输入至多视角人像生成模型中进行图像生成,得到初始人像在多个不同视角下的完整图像。采用本方法能够提高了生成结果的可控性与图像质量。
技术关键词
人像生成方法 多视角 大语言模型 文本生成模型 服饰 文本输入界面 姿态控制模块 输入区 计算机设备 注意力机制 多模态 图像生成模型 花纹 场景 纹理 面部 计算机程序产品
系统为您推荐了相关专利信息
1
一种基于知识图谱和检索增强的政务问答方法及系统
政务 答案 多模态信息 大语言模型 文本
2
一种企业知识库智能文档查询方法和系统
企业知识库 智能文档 大语言模型 生成提示词 生成文档
3
一种基于大语言模型的代码驱动具身智能体的后门攻击链方法
后门 大语言模型 视觉触发器 生成对抗网络 有效性
4
大语言模型越狱攻击的防御方法、系统、设备和存储介质
大语言模型 解码器 特征提取模块 基准 探针
5
一种多模态数据集的构建方法及系统
大语言模型 离线 光学字符识别技术 分析用户需求 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号