摘要
本发明属于图像处理技术领域,公开了一种基于手绘草图的复杂场景图像生成系统及方法,包括:通过获取草图图像,并对草图图像进行特征提取,得到草图特征;同时,基于大语言模型对草图进行分析,得到草图语义文本描述,对该文本进行特征提取,得到文本特征;然后,将草图特征与文本特征对齐,得到草图中包含的物体及背景布局信息;最后,基于草图布局及形状轮廓信息,通过预设的生成模型进行图像生成,得到目标复杂场景图像。本发明能够基于简单的人类手绘草图快速、智能地得到高质量的场景图像,无需复杂的提示,有效提高了场景图像生成效率和场景图像生成质量。
技术关键词
图像生成方法
手绘草图
图像生成装置
图像生成系统
场景
大语言模型
服务端
图像生成模型
文本
对齐模块
物体
推理装置
解码网络
终端
布局
界面
草图识别
形态
系统为您推荐了相关专利信息
轨迹
卡尔曼滤波
深度学习方法
红外监视
识别方法
多模态特征融合
二维图像特征
数据
样本
语义特征提取
教学评价系统
VR动作捕捉
交互特征
VR交互
人机协同
卷积模块
无人机场景
拼接模块
检测识别模块
图像检测方法