一种图像生成模型训练方法及相关设备

AITNT
正文
推荐专利
一种图像生成模型训练方法及相关设备
申请号:CN202411921331
申请日期:2024-12-25
公开号:CN119851059A
公开日期:2025-04-18
类型:发明专利
摘要
本发明提供了一种图像生成模型训练方法及相关设备,所述方法包括:基于获取的多个行人图像生成第一文本提示和RGBA语义图,第一文本提示中添加有第一行人的身份ID标签;基于构建的训练数据对预设模型进行迭代训练,得到图像生成模型,训练数据包括行人图像、第一文本提示和RGBA语义图组成的第一样本对,图像生成模型用于根据目标对象的输入图像生成目标对象多视角的输出图像。不同场景和视角下的行人图像具有更好的泛化能力,在实际应用中表现更加稳定和可靠,能够生成高质量的目标对象多视角输出图像。
技术关键词
图像生成模型 ID标签 文本 多视角 语义 红绿蓝 对象 距离信息 透明度 数据 可读存储介质 计算机程序产品 色彩 身份 训练装置 处理器通信
系统为您推荐了相关专利信息
1
一种基于深度学习的语音对话设备
语音对话设备 信噪比估计值 语音识别模块 图谱特征 降噪模块
2
一种基于单张静态图像的高保真动态场景视频生成方法
动态场景视频 高保真视频 生成方法 深度特征提取 生成视频序列
3
一种基于多模态的代码结构融入大模型方法及系统
代码结构 大语言模型 多模态 生成代码 文本编码器
4
视觉问答多模态大模型建立方法和装置
多模态 文本 数据 视觉 模型建立方法
5
钢结构桥梁锈蚀病害语义分割方法、装置、设备及介质
钢结构桥梁 图像块 语义分割方法 语义分割算法 图片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号