一种基于语义增强混合重建的三维生成方法

正文

推荐专利

一种基于语义增强混合重建的三维生成方法

申请号：CN202411384389

申请日期：2024-09-30

公开号：CN119273871A

公开日期：2025-01-07

类型：发明专利

摘要

本发明公开了一种基于语义增强混合重建的三维生成方法，包括步骤：1、利用GPT‑4模型将输入的原始文本进行语义增强；2、文本生成二维图像；将语义增强的文本输入到文生图扩散模型，使得生成的二维图像有助于三维重建；3、从二维图像生成多视图，将文生图扩散模型中生成的图像输入多视图扩散模型，生成不同视角下的图像，用来进行三维重建；4、使用图像和文本进行三维混合重建，将生成的多视图和原始文本作为输入，通过三维大型重建模型生成三平面表示；5、从三平面表示生成三维网格；将三平面表示作为输入，利用FlexiCubes进行等值面提取，得到最终的三维网格。本发明解决了三维对象生成缓慢，质量低下，与语义不对齐的情况。

技术关键词

三维生成方法文本语义令牌跨模态融合策略多层感知机层交叉注意力机制融合特征解码器图像编码器生成框架网格图像嵌入融合方法矩阵视觉多视角代表

系统为您推荐了相关专利信息

一种日志质量检测方法、系统、电子设备及存储介质

抽象语法树日志大语言模型生成代码语义

流程图图像的解析与结构化重建方法、设备及存储介质

可视化界面节点文本元素箭头

数据合规确定方法、装置、电子设备和存储介质

标签风险字段电子设备模式匹配

一种基于改进lcs算法的文档对比方法

LCS算法对象列表字符 Wunsch算法

基于自适应阈值脉冲神经网络的多模态人机交互芯片

运动意图传感器模块芯片识别模块生成特征

一种基于语义增强混合重建的三维生成方法

站点导航

APP 下载