摘要
本发明提供了一种基于二维图像联合先验的文本到3D模型生成方法,包括:S1.二维图像生成;S2.图像信息与文本联合嵌入:通过图像编码器提取二维图像的全局嵌入,同时获取文本提示信息的文本嵌入,二者维度一致;S3.图像联合先验的分数蒸馏采样;S4.损失增益优化;S5.视角匹配增强。本发明方法解决了文本到3D模型生成过程中出现的失真以及视角不一致问题,可以满足应用于不同场景下的设计和资产化需求;通过将图像信息联合文本提示信息,图像嵌入与文本嵌入特征对齐联合先验,能够实现兼顾模型的语义表达和视觉细节,能够有效提升3D模型生成的质量和效率。
技术关键词
模型生成方法
文本
高分辨率纹理
视觉特征提取
图像编码器
蒸馏
图像嵌入
嵌入特征
语义
阶段
分层次
噪声
多视角
网格
基元
资产
相机
系统为您推荐了相关专利信息
分类预测方法
电力客服工单
场景分类
双向长短期记忆网络
动态语义特征
数据快速查询方法
解析工具
结构化数据格式
语音输入方式
非结构化文本
旅游行程规划方法
交通
关键词
旅游行程规划系统
聚类算法