基于像素空间扩散生成的无飞点单目深度估计方法和装置

正文

推荐专利

申请号：CN202511026113

申请日期：2025-07-24

公开号：CN120976281A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及计算机视觉深度估计技术领域，特别是涉及一种基于像素空间扩散生成的无飞点单目深度估计方法和装置，本发明通过视觉基础模型提取出输入图像中的高级语义表示，并通过语义引导DiT块接收所述高级语义表示作为引导信号，增强了全局图像结构和细粒度细节的建模，同时保留了DiT块的简单性和可扩展性；语义引导DiT块有效地模拟了全局图像结构和细粒度细节，从而显著提高了深度预测的准确性；通过集成高级语义表示，直接在像素空间而不是潜在空间中执行扩散的深度预测，允许直接模拟深度的像素分布，而不是通过VAE将深度图压缩到潜在空间中再进行深度估计，从而避免了飞点对深度估计图的影响。

技术关键词

单目深度估计方法语义噪声样本像素深度预测模型计算机可执行指令微分方程求解器多层感知器网络图像结构深度估计技术图像投影边缘检测算子计算机存储介质双线性插值生成噪声点云视觉

系统为您推荐了相关专利信息

一种碳酸锂制备工艺的智能控制方法及系统

智能控制方法在线粒度分析仪深度预测模型数字孪生传感器阵列

基于大语言模型的前端代码生成方法、系统及电子设备

前端组件大语言模型前端代码生成方法指令开源数据库

社交电商的佣金结算对账方法、装置、计算机设备和存储介质

账单计算机可读指令字段标识电商

一种特征解缠卷积神经网络变换模型域自适应方法

图像解码器样本标记网络聚类方法

自适应环境的软光敏检测方法

编码向量时序特征模式语义特征特征值

基于像素空间扩散生成的无飞点单目深度估计方法和装置

站点导航

APP 下载