摘要
本发明公开了使用多模态生成式AI的改进的3D模型生成。在各种示例中,公开了涉及通过使用文本编码器对文本提示进行编码以及使用2D/3D编码器对对象的2D图像或对象的3D表示进行编码来生成输出3D潜在表示的系统和方法。通过将输出3D潜在表示应用于解码器来生成3D输出。确定3D输出的重构损失和SDS损失。使用重构损失和SDS损失更新文本编码器、2D/3D编码器和解码器中的至少一个。
技术关键词
文本编码器
解码器
对话式人工智能
对象
机器学习模型
区域监控系统
图像
参数
协作内容
彩色点云
重构
大语言模型
医疗系统
感知系统
数字孪生
数据中心
占用栅格
系统为您推荐了相关专利信息
实时性能监控
分布式数据库
扩展系统
性能指标数据
数据库性能指标
交互式虚拟现实
动态预测模型
生成方法
虚拟现实设备
数字孪生
模型构建方法
残差预测
噪声预测模型
生成高分辨率
海底地形地貌探测
局部放电现象
智能监控方法
低压配电
电信号
机器学习模型