一种多模态可控人像生成方法及系统

正文

推荐专利

一种多模态可控人像生成方法及系统

申请号：CN202510236206

申请日期：2025-02-28

公开号：CN120235973A

公开日期：2025-07-01

类型：发明专利

摘要

本发明提出一种多模态可控人像生成方法及系统，涉及图像生成的技术领域，方法包括首先对原始人像图片进行多模态输入条件解耦，得到多模态解耦结果；然后对所述多模态解耦结果进行预处理，得到图像嵌入结果和文本嵌入结果；再将所述图像嵌入结果进行拼接，得到拼接嵌入；最后将所述拼接嵌入和所述文本嵌入结果输入至预设的人像生成网络，输出可控人像生成结果。本发明能在解耦多模态输入条件下有效提高生成图像的灵活性和精确性。

技术关键词

人像生成方法图像嵌入多模态表达式文本图像分割网络图片布局注意力编码器坐标颜色信噪比拼接模块矩形生成系统半轴输出模块

系统为您推荐了相关专利信息

红外建模参数反演模型的确定方法、应用方法及相关装置

反演模型参数船体钢板亮度太阳

一种基于图大模型的勒索病毒检测方法

勒索病毒检测方法大语言模型多尺度信息阶段全局结构信息

一种基于大模型的铁路勘察设计标准规范检索方法

检索方法关键词铁路文本数据库查询语句

模型训练方法、装置、设备、存储介质和产品

大语言模型文本多模态模型训练方法答案

节点故障处理方法、装置、电子设备、介质及产品

服务器集群选举方法故障检测选举算法客户端

一种多模态可控人像生成方法及系统

站点导航

APP 下载