一种多模态可控人像生成方法及系统

AITNT
正文
推荐专利
一种多模态可控人像生成方法及系统
申请号:CN202510236206
申请日期:2025-02-28
公开号:CN120235973A
公开日期:2025-07-01
类型:发明专利
摘要
本发明提出一种多模态可控人像生成方法及系统,涉及图像生成的技术领域,方法包括首先对原始人像图片进行多模态输入条件解耦,得到多模态解耦结果;然后对所述多模态解耦结果进行预处理,得到图像嵌入结果和文本嵌入结果;再将所述图像嵌入结果进行拼接,得到拼接嵌入;最后将所述拼接嵌入和所述文本嵌入结果输入至预设的人像生成网络,输出可控人像生成结果。本发明能在解耦多模态输入条件下有效提高生成图像的灵活性和精确性。
技术关键词
人像生成方法 图像嵌入 多模态 表达式 文本 图像分割网络 图片 布局 注意力 编码器 坐标 颜色 信噪比 拼接模块 矩形 生成系统 半轴 输出模块
系统为您推荐了相关专利信息
1
红外建模参数反演模型的确定方法、应用方法及相关装置
反演模型 参数 船体钢板 亮度 太阳
2
一种基于图大模型的勒索病毒检测方法
勒索病毒检测方法 大语言模型 多尺度信息 阶段 全局结构信息
3
一种基于大模型的铁路勘察设计标准规范检索方法
检索方法 关键词 铁路 文本 数据库查询语句
4
模型训练方法、装置、设备、存储介质和产品
大语言模型 文本 多模态 模型训练方法 答案
5
节点故障处理方法、装置、电子设备、介质及产品
服务器集群 选举方法 故障检测 选举算法 客户端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号