摘要
本申请公开了一种图像生成方法、装置及电子设备,属于计算机视觉与图像处理技术领域。方法包括:将目标建筑的特征信息输入多模态大语言模型,通过多模态大语言模型基于特征信息进行跨模态推理,获取目标建筑的关键环境语义信息;利用关键环境语义信息构建目标建筑的空间体块模型;根据空间体块模型,以及用户选择的目标观察配置,生成目标空间条件控制图;其中,目标空间条件控制图为空间体块模型与目标观察配置对应的视角截图;将关键环境语义信息和目标空间条件控制图输入条件扩散模型,得到目标建筑的与目标观察配置对应的初始视角图像;根据初始视角图像,确定目标建筑的目标视角图像。本申请可以提高图像生成的效果。
技术关键词
大语言模型
图像生成方法
视角
语义
建筑
多模态
编辑
训练样本集
跨模态
边缘检测
输入模块
模版
推理规则
图像处理技术
模板
计算机视觉
指令
文本
电子设备
系统为您推荐了相关专利信息
智能问答方法
意图分类模型
构建知识图谱
朴素贝叶斯
词语
协同神经网络
图像语义分割
细粒度神经网络
细粒度特征
Softmax分类器
搅拌摩擦焊焊缝缺陷
智能检测方法
双通道注意力
激光三维扫描仪
并行特征