摘要
本公开的实施例涉及利用局部化约束的文本到图像生成神经网络生成合成数字图像。公开了用于经由具有局部化约束的生成式神经网络生成数字图像的方法、系统和非暂态计算机可读存储介质。所公开的系统利用一个或多个编码器神经网络生成嵌入序列,该嵌入序列包括表示文本提示的提示嵌入和表示指示文本提示中的对象的短语的对象文本嵌入。所公开的系统利用一个或多个编码器神经网络生成表示与对象相对应的对象图像的视觉嵌入。所公开的系统通过在嵌入序列中用视觉嵌入替换对象文本嵌入来确定经修改的嵌入序列。所公开的系统还利用生成式神经网络根据包括视觉嵌入的经修改的嵌入序列来生成合成数字图像。
技术关键词
对象
文本
视觉
序列
图像生成神经网络
编码器
计算机
修改数字图像
处理器
生成数字图像
掩模
注意力
字幕
存储器设备
图像嵌入
参数
可读存储介质
系统为您推荐了相关专利信息
文档搜索系统
多维数据驱动
主题特征
子模块
排序算法
内存管理装置
符号
内存管理方法
表达式
深度学习模型
充电工况
电芯老化
特征提取网络
健康状态预测方法
数据
跟踪定位方法
多模态传感器
图像序列数据
视觉传感器
三维点云数据