摘要
本发明提供一种全景街景图像生成方法及系统,属于图像数据处理技术领域。本发明直接生成完整的具有真实畸变的全景图像,不需要通过多视角图像拼接的方式,能够在保留精确几何控制的基础上,生成具有全局亮度一致性和无缝衔接的并且带有真实畸变的高保真全景街景图像,并且提升了图像的真实性和一致性,减少了多视角生成的复杂度,显著提高了在自动驾驶场景中的适用性和实时性。通过引入多尺度几何控制及条件编码,结合预训练扩散模型,从道路BEV地图、3D目标框、相机姿态、文本描述等多条件输入生成具有真实畸变的全景街景图像,在生成过程中能够精确控制道路高程、目标物体高度等几何细节,显著提升了3D感知任务的训练效果。
技术关键词
图像生成方法
街景
编码特征
文本
场景
注意力机制
上采样
多尺度特征解码
生成多尺度
地图
图像数据处理技术
双线性插值算法
相机
分类器
调节噪声