一种基于扩散模型的多风格绘本生成方法

AITNT
正文
推荐专利
一种基于扩散模型的多风格绘本生成方法
申请号:CN202411734471
申请日期:2024-11-29
公开号:CN119228633B
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于扩散模型的多风格绘本生成方法,包括:S1:构建数据集;步骤S2:构建绘本生成模型;预处理模块对绘本图像及故事文本编码,获取文本嵌入、角色掩码和角色图像;S3:导入风格参考图像至风格一致性模块,获取风格特征嵌入;S4:导入文本嵌入、角色掩码和角色图像至角色一致性模块,获取角色嵌入和布局嵌入;S5:导入绘本图像、风格特征嵌入、角色嵌入和布局嵌入至Unet模块中进行绘本图像噪声预测,获取预测的绘本图像;S6:构建损失函数。本发明结合了深度学习中的扩散模型与图像风格迁移算法,能够根据输入的参考图像生成具有多种艺术风格的连贯绘本场景,可以广泛应用于动画制作、图像创意设计及数字内容生成等领域。
技术关键词
风格 生成方法 多层感知机 图像分割模型 文本编码器 图像编码器 噪声预测 模块 交叉注意力机制 布局 语义 大语言模型
系统为您推荐了相关专利信息
1
一种高频石英晶体谐振器的低损伤双面离子束刻蚀方法
离子束刻蚀方法 氧气混合比例 残差网络模型 因子 石英晶片
2
一种海量ASC高程数据的快速等高线生成方法
语义分割模型训练 生成方法 深度学习框架 农田 区域高程数据
3
机器学习模型训练方法和装置、知识库生成方法和装置
知识库生成方法 样本 机器学习模型训练 文本 存储器
4
文本生成方法、装置、电子设备及存储介质
对象 文本生成方法 文本生成模型 风格 大语言模型
5
图像编辑和模型训练方法、设备、存储介质及程序产品
编码特征 字形特征 样本 图文 文本内容特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号