一种基于扩散模型的多风格绘本生成方法

AITNT
正文
推荐专利
一种基于扩散模型的多风格绘本生成方法
申请号:CN202411734471
申请日期:2024-11-29
公开号:CN119228633B
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于扩散模型的多风格绘本生成方法,包括:S1:构建数据集;步骤S2:构建绘本生成模型;预处理模块对绘本图像及故事文本编码,获取文本嵌入、角色掩码和角色图像;S3:导入风格参考图像至风格一致性模块,获取风格特征嵌入;S4:导入文本嵌入、角色掩码和角色图像至角色一致性模块,获取角色嵌入和布局嵌入;S5:导入绘本图像、风格特征嵌入、角色嵌入和布局嵌入至Unet模块中进行绘本图像噪声预测,获取预测的绘本图像;S6:构建损失函数。本发明结合了深度学习中的扩散模型与图像风格迁移算法,能够根据输入的参考图像生成具有多种艺术风格的连贯绘本场景,可以广泛应用于动画制作、图像创意设计及数字内容生成等领域。
技术关键词
风格 生成方法 多层感知机 图像分割模型 文本编码器 图像编码器 噪声预测 模块 交叉注意力机制 布局 语义 大语言模型
系统为您推荐了相关专利信息
1
一种子宫内膜癌术后CTV分割模型的训练方法
数据中心 子宫 组学特征 样本 多模态
2
融合环境信息的语音生成方法及装置、存储介质、设备
语音生成方法 文本 语义 关键字 声音信号处理技术
3
一种图像和谐化处理方法及相关设备
注意力 像素 参数 图像分割模型 计算机程序产品
4
模型训练方法、三维生成方法及其装置、设备和存储介质
三维生成方法 视角 模型训练方法 二维图像特征 符号
5
基于Mamba架构的下颌神经管CBCT全景图像分割网络训练方法
图像分割网络 上采样 全景图像处理方法 卷积模块 多层感知机层
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号