三维场景中图像生成方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202510492010

申请日期：2025-04-18

公开号：CN120543734A

公开日期：2025-08-26

类型：发明专利

摘要

本申请实施例提供三维场景中图像生成方法、装置、设备和存储介质，涉及图像处理技术领域。该方法将获取的视图角度输入网格神经辐射场进行图像渲染生成初始图像，根据时间步长为初始图像添加噪声得到噪声图像，将文本提示信息、噪声图像和时间步长输入图文大模型进行图像生成，得到第一梯度以及与第二梯度，根据第一梯度和第二梯度生成对应于网格神经辐射场的损失值，基于损失值对网格神经辐射场进行模型调整。利用文本提示信息提供语义引导生成过程朝着与文本提示信息相关的方向优化，减少随机噪声的干扰，利用噪声图像提供几何约束确保生成结果在几何上与目标的场景一致，提升生成准确率。另外避免复杂的分数函数映射过程，提升优化效率。

技术关键词

噪声图像图像生成方法文本度量网格图文协方差矩阵场景视角因子生成特征随机噪声图像生成装置参数图像处理技术开方电子设备数据

系统为您推荐了相关专利信息

一种跨领域多轮语义识别框架及语义识别方法

语义识别系统文本识别模块语义识别方法单轮

一种合成孔径雷达卫星回波域数据物体逆认知方法及装置

合成孔径雷达卫星网格雷达回波数据计算机可存储介质信息数据处理终端

芯片封装结构及芯片封装方法

芯片封装方法芯片封装结构玻璃金属线网格状结构

多特征嵌入的唐代服饰命名实体识别方法

命名实体识别方法服饰序列字符标签

基于人工智能的工业配电安全预警方法及系统

工业配电噪声数据预警方法设备运行数据因子

三维场景中图像生成方法、装置、设备和存储介质

站点导航

APP 下载