摘要
本申请涉及了一种可捕获描述细节的图像生成方法、装置、设备及介质,方法基于自然语言处理器将原始描述文本拆分成多段关键字组成的关键字数组,其中多段关键字中的后一段关键字相较于前一段关键字具有更多的原始描述文本的关键信息。本方法能够在处理人类语言时,将其转换为多段关键字组成的关键字数组,相较于原扩散模型能够更好的捕捉人类语言中的细节,生成和原始描述文本高度一致的图像,在基于长文本的内容生成领域尤其有效。
技术关键词
关键字
图像生成方法
文本
图像生成器
图像生成装置
计算机可执行指令
图像生成单元
自然语言
数据获取单元
噪声
可读存储介质
处理器通信
网络
存储器
人类
分辨率
电子设备
系统为您推荐了相关专利信息
编码模块
稳态特征
特征提取模块
随机噪声
依赖特征
深度学习模型
BERT模型
语法结构
条件随机场
实体