摘要
本发明涉及图像处理技术领域,具体地说,涉及基于生成对抗网络的多模态数据合成系统。其包括动态分层划分单元、交互式选择单元、多模态特征对齐单元和阶段无缝拼接单元。本发明避免全局优化的限制,允许更精细的局部调整,使用户可以标记特定区域并输入描述,满足个性化需求,在保证文本和图像特征的一致性增强了生成结果的质量和风格一致性的前提下,用户可根据需求选择时间或精度优先,适应不同的使用场景。
技术关键词
生成对抗网络
多模态特征
无缝拼接单元
层级
图像特征提取
编码向量
文本
预训练语言模型
交互式界面
手绘工具
特征点
输入模块
融合算法
交叉注意力机制
语义