一种数据合成的方法及基于合成数据进行单目三维重建的训练方法

正文

推荐专利

申请号：CN202411080189

申请日期：2024-08-07

公开号：CN119131235A

公开日期：2024-12-13

类型：发明专利

摘要

本发明涉及三维重建技术领域，提供一种数据合成的方法及基于合成数据进行单目三维重建的训练方法，第一步，将一张含有特定物体的图片渲染成多张对应该物体在不同角度的图片I；第二步，基于图片I，得到该物体的遮罩m，其中；第三步，利用遮罩m和额外输入的文本描述，引导图片生成模型利用图片I生成符合文本描述且保留特定物体结构信息的新图片。本发明通过不同视点、风格和背景条件生成的大量3D模型和图片对，提供了丰富的训练数据集，这种多样性可以显著提高单目三维重建模型的泛化能力。通过在多个视点(R,T)的一定角度范围内随机施加扰动，提升了模型对不同相机位姿的适应能力，增强了单目三维重建的鲁棒性。

技术关键词

注意力物体三维模型引导图片编辑文本索引保留高频信息图片转数据卷积神经网络提取编码器三维重建模型边缘轮廓图三维重建技术卷积解码器语义分割模型像素

系统为您推荐了相关专利信息

基于多模态融合的机器视觉情感识别与交互系统及其方法

识别偏差情绪识别模型情绪特征交互方法多模态情绪

一种基于注意力金字塔网络的全天空云图检测和分类方法

金字塔网络分类方法全天空云图上下文特征混合损失函数

一种直锥复合筒的一体成型方法

塑性变形量一体成型方法零件热成型线膨胀系数

配电房智能巡检方法及系统

配电房智能 YOLO模型巡检方法压缩特征网络

一种基于人工智能的短视频制作方法及系统

视频制作方法多模态融合特征音频注意力

一种数据合成的方法及基于合成数据进行单目三维重建的训练方法

站点导航

APP 下载