摘要
本发明公开了一种基于三维几何一致注意力先验的交互式三维高斯编辑方法及系统。该方法首先通过三维高斯泼溅技术生成多视角源图像,利用扩散模型进行初步编辑并交互式选择关键视图;然后采用CLIP模型筛选语义一致的参考视图,构建三维几何一致注意力先验;最后通过自适应跨维度注意力融合网络将三维先验与二维扩散模型注意力动态融合,实现多视图一致的编辑结果。本发明通过引入用户交互式关键视图选择、参考视图语义筛选以及基于3D约束的注意力融合,有效解决了现有三维编辑过程中多视图不一致和局部细节丢失的问题,显著提高了编辑效果的几何一致性和细节还原能力。
技术关键词
注意力先验
编辑方法
语义
动态门控
场景编辑系统
多视角
指数衰减函数
特征提取单元
模块
文本编码器
图像编码器
投影单元
分配单元
处理器
系统为您推荐了相关专利信息
人体姿态判别
模式挖掘方法
三维卷积神经网络
人体动作识别
动作视频提取
数字孪生模型
动态仿真方法
语义框架
机器学习算法
建筑能效管理
膨胀土边坡
计算方法
一维卷积神经网络
裂缝
深度学习模型
长短期记忆网络
语义特征
重传方法
分类网络
分类器