摘要
本申请涉及图像处理技术领域,提供一种漫画图像生成方法、装置、设备及存储介质,方法包括:获取小说文本中各个角色对应的初始角色图像;基于预设的语言模型的第一语言子模型,确定小说文本中至少一个分镜对应的分镜文本;基于语言模型的第二语言子模型,根据分镜文本,确定分镜对应的分镜提示词、角色提示词和角色分布位置;基于预设的文生图模型的第一图像子模型,根据初始角色图像、分镜对应的角色提示词和角色分布位置,确定分镜中角色的姿态;基于文生图模型的第二图像子模型,根据分镜中各个角色对应的初始角色图像、角色的姿态和分镜提示词,确定分镜对应的分镜图像。通过预设的语言模型和文生图模型生成的分镜图像中角色和文本描述一致。
技术关键词
图像生成方法
漫画
文本
适配器
关键点
图像生成装置
计算机设备
可读存储介质
存储计算机程序
图像处理技术
网络
处理器
模块
存储器
坐标
系统为您推荐了相关专利信息
语音识别模型
文本
情感识别模型
声纹识别模型
错误率
文本编码器
文本检测方法
大语言模型
检测器
对齐模块
深度强化学习模型
敏感信息检测方法
信息检测装置
信息检测模块
存储计算机程序