利用文本和2D边界框同时生成多个3D物体的方法及系统

AITNT
正文
推荐专利
利用文本和2D边界框同时生成多个3D物体的方法及系统
申请号:CN202411037901
申请日期:2024-07-31
公开号:CN119006759B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开一种利用文本和2D边界框同时生成多个3D物体的方法及系统,包括3D内容增强模块、布局控制模块、多视图一致性控制模块以及布局和多视图知识整合模块。其中3D内容增强模块用于提升生成的3D内容的质量,布局控制模块用于控制同时生成的多个3D物体之间的位置,多视图一致性控制模块用于维持生成的多个物体的多视图一致性,布局和多视图知识整合模块用于统一蒸馏的多种知识并进一步增强生成物体的质量。本发明不需要改变预训练模型的结构和参数,同时解决了现有方法中存在的无法理解输入文本中复杂逻辑关系,只能生成单个物体的问题。
技术关键词
布局 物体 文本 控制模块 蒸馏 图片 噪声 多层感知机 预训练模型 视角 可读存储介质 编码 矩阵 误差 计算机 处理器 参数
系统为您推荐了相关专利信息
1
一种集成电路版图设计教学辅助方法
集成电路版图设计 教学辅助方法 电路器件 元件 版图设计规则
2
基于知识图谱的新能源汽车产品全生命周期问题管理方法
新能源汽车 产品全生命周期 三元组 知识抽取方法 管理方法
3
一种血液透析治疗智能控制系统
血液透析治疗 透析液泵 智能控制系统 语音采集模块 语音控制模块
4
一种液态金属电池老化分析方法及其分析系统
液态金属电池 老化分析方法 充放电曲线 欧姆电阻 遗传算法
5
一种基于AprilTag标签的硬件资源分配优化方法及系统
AprilTag标签 分配优化方法 像素矩阵 像素点 数据转换模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号