摘要
本发明公开了文本引导的3D针织产品模型生成与编辑方法及装置,涉及计算机视觉领域,方法包括:S1,使用3D扩散模型将针织产品提示文本生成初始点云;S2,对初始点云优化并初始化为3D高斯;S3,对初始3D高斯进行投影渲染得到多视角图像序列,基于编辑提示文本对其进行语义分割,得到掩码序列;S4,基于掩码序列获取带语义标签的3D高斯;S5,将带语义标签的3D高斯投影到2D平面得到渲染图像;将渲染图像与编辑提示文本输入2D扩散模型,输出损失梯度;利用损失梯度指导3D高斯进行迭代,迭代完成得到的3D高斯即最终的3D针织产品模型。本发明通过引进3D高斯,使用编辑提示文本为3D高斯添加语义标签,兼顾了生成效率、局部语义控制与高精度编辑。
技术关键词
针织产品
语义标签
编辑方法
多视角
序列
点云
噪声预测
图像
三维坐标信息
颜色
语义分割模型
文本编码器
针孔相机
编辑装置
渲染技术
像素
系统为您推荐了相关专利信息
电池单体
电池热失控
预警模型
生成方法
时序特征
多模态特征融合
身份认证方法
面部图像数据
移动设备
融合特征
动物模型
基因敲除技术
基因工程技术
毛细血管内皮细胞
中枢神经系统损伤
教育系统
生成视频序列
协同注意力
动态教学
渲染技术