摘要
本发明实施例提供了一种图像生成方法、装置、电子设备及介质,涉及计算机技术领域。该方法包括:将目标图像提示词作为输入数据输入预设的大语言模型,以通过大语言模型对目标图像提示词进行解析,获得一个或多个指定人物在车内空间的方位信息;根据该方位信息,确定一个或多个指定人物对应的位置编码;根据一个或多个指定人物对应的位置编码、目标图像提示词和预设的文生图模型,生成目标图像,目标图像上包括指定车辆和一个或多个指定人物,且一个或多个指定人物位于指定车辆内该位置编码对应的位置。该方法通过位置编码引导文生图模型的生成,能够稳定地生成任意的车内环境,提高了生产效率和视觉内容生成的质量。
技术关键词
边缘轮廓图
编码
图像生成方法
人物模型
大语言模型
车辆模型
文本
布局
车辆外观
图像生成装置
生成深度图
摄像机
通信接口
电子设备
数据
存储器
计算机程序产品
系统为您推荐了相关专利信息
仓储机器人
实时状态信息
导航控制器
数字图像传感器
测距模块
多路音频传输方法
音频特征数据
指数
短时傅里叶变换
音频采集模块