摘要
本申请属于计算机视觉的图像生成技术领域,公开了一种人脸多姿态生成方法、系统、电子设备及存储介质,该方法首先获取源人脸的正面图像、目标姿态参考图像和个性化编辑提示词;然后,利用IP‑Adapter模块提取并注入正面图像的身份特征至预设的扩散模型,同时利用ControlNet模块根据目标姿态信息生成并注入姿态控制条件至该扩散模型;最后,所述扩散模型结合所述身份特征、所述姿态控制条件及可选文本提示词对应的文本特征,通过逐步去噪过程生成与目标姿态一致且保持源人脸身份特征的多姿态人脸图像。本发明通过结合ControlNet的精确姿态控制能力和IP‑Adapter的身份保持与编辑能力,并基于扩散模型的稳定生成特性,实现了高质量、高可控性的人脸多姿态生成。
技术关键词
关键点
人脸姿态
编辑
文本编码器
图像编码器
生成方法
交叉注意力机制
姿态控制模块
图像生成技术
人脸五官
人脸身份
电子设备
副本
可读存储介质
特征提取模块
系统为您推荐了相关专利信息
实时视频流
人机交互方法
动作交互
后台服务器
WebSocket服务器
农业大棚智能
监测控制系统
因子
环境调控设备
样本
超声机器人
图像分析方法
体数据结构
控制力矩
多模态
看护系统
人体骨骼关键点
远程监控平台
监护系统
视频流