摘要
本发明公开一种利用文本和2D边界框同时生成多个3D物体的方法及系统,包括3D内容增强模块、布局控制模块、多视图一致性控制模块以及布局和多视图知识整合模块。其中3D内容增强模块用于提升生成的3D内容的质量,布局控制模块用于控制同时生成的多个3D物体之间的位置,多视图一致性控制模块用于维持生成的多个物体的多视图一致性,布局和多视图知识整合模块用于统一蒸馏的多种知识并进一步增强生成物体的质量。本发明不需要改变预训练模型的结构和参数,同时解决了现有方法中存在的无法理解输入文本中复杂逻辑关系,只能生成单个物体的问题。
技术关键词
布局
物体
文本
控制模块
蒸馏
图片
噪声
多层感知机
预训练模型
视角
可读存储介质
编码
矩阵
误差
计算机
处理器
参数
系统为您推荐了相关专利信息
集成电路版图设计
教学辅助方法
电路器件
元件
版图设计规则
新能源汽车
产品全生命周期
三元组
知识抽取方法
管理方法
血液透析治疗
透析液泵
智能控制系统
语音采集模块
语音控制模块
液态金属电池
老化分析方法
充放电曲线
欧姆电阻
遗传算法
AprilTag标签
分配优化方法
像素矩阵
像素点
数据转换模块