一种基于多模态特征引导的稀疏视角下三维场景重建方法

正文

推荐专利

申请号：CN202411701347

申请日期：2024-11-26

公开号：CN119672213B

公开日期：2025-12-05

类型：发明专利

摘要

本发明公开了一种基于多模态特征引导的稀疏视角下三维场景重建方法，所述方法包括：对初始稀疏视角图像编码器、初始多模态引导模块和初始三维高斯参数预测器进行训练；将稀疏视角图像分别输入到训练好的稀疏视角图像编码器和冻结参数的图像分割模型中，得到浅层图像特征和分割特征，将稀疏视角文本描述输入到冻结参数的文本编码器中得到文本特征；在训练好的多模态引导模块中，利用分割特征和文本特征对浅层图像特征进行优化和提炼，得到多模态融合特征；使用训练好的三维高斯参数预测器，根据多模态融合特征重建三维场景。本发明融合图像和文本模态的特征，在多模态特征引导下，使用稀疏视角图像实现高质量的三维场景重建，具有较高的鲁棒性。

技术关键词

三维场景重建方法视角图像分割模型多模态特征图像编码器文本编码器重建三维场景融合特征三维场景重建系统参数跨模态视频帧 Softmax函数注意力扫描模块

系统为您推荐了相关专利信息

一种通过二维编辑增强三维数字人生成方法

生成方法轨迹编辑变量深度学习技术

一种基于细粒度视觉提示的医学视觉问答推理方法

图像嵌入推理方法图像编码器视觉特征分层提取器

基于全局特征的三维CAD模型检索方法、设备及介质

盒特征分布特征数据 web框架点云

一种基于CT图像的胰腺肿瘤自动分割方法

肿瘤自动分割方法深度神经网络模型胰腺癌患者适配器配置网络

一种可驱动的物理真实数字人仿真方法

仿真方法姿势蒙皮方法深度图图片

一种基于多模态特征引导的稀疏视角下三维场景重建方法

站点导航

APP 下载