利用文本和2D边界框同时生成多个3D物体的方法及系统

正文

推荐专利

申请号：CN202411037901

申请日期：2024-07-31

公开号：CN119006759B

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开一种利用文本和2D边界框同时生成多个3D物体的方法及系统，包括3D内容增强模块、布局控制模块、多视图一致性控制模块以及布局和多视图知识整合模块。其中3D内容增强模块用于提升生成的3D内容的质量，布局控制模块用于控制同时生成的多个3D物体之间的位置，多视图一致性控制模块用于维持生成的多个物体的多视图一致性，布局和多视图知识整合模块用于统一蒸馏的多种知识并进一步增强生成物体的质量。本发明不需要改变预训练模型的结构和参数，同时解决了现有方法中存在的无法理解输入文本中复杂逻辑关系，只能生成单个物体的问题。

技术关键词

布局物体文本控制模块蒸馏图片噪声多层感知机预训练模型视角可读存储介质编码矩阵误差计算机处理器参数

系统为您推荐了相关专利信息

一种集成电路版图设计教学辅助方法

集成电路版图设计教学辅助方法电路器件元件版图设计规则

基于知识图谱的新能源汽车产品全生命周期问题管理方法

新能源汽车产品全生命周期三元组知识抽取方法管理方法

一种血液透析治疗智能控制系统

血液透析治疗透析液泵智能控制系统语音采集模块语音控制模块

一种液态金属电池老化分析方法及其分析系统

液态金属电池老化分析方法充放电曲线欧姆电阻遗传算法

一种基于AprilTag标签的硬件资源分配优化方法及系统

AprilTag标签分配优化方法像素矩阵像素点数据转换模块

利用文本和2D边界框同时生成多个3D物体的方法及系统

站点导航

APP 下载