摘要
一种基于文本控制的三维场景局部编辑方法,包括:基于文本查询构建三维高斯语义场,通过嵌入语义特征至各向异性高斯基元,并结合CLIP模型的多视角语义监督与余弦相似度计算,直接生成精确的三维对象掩码;以目标对象为中心筛选有效视角,通过方位角聚类分析和核密度估计确定有效视角范围,并生成连续稠密的环视相机轨迹;采用图像网格技术组织编辑视角,利用融合全局‑局部注意力的潜空间对齐模块GLAM同步处理多帧图像,通过跨视角注意力机制统一风格基准并增强几何一致性,生成多视角一致的编辑结果,并仅微调目标对象对应的高斯参数,保留背景区域不变。本发明的方法显著提升了局部编辑的边界清晰度,实现多目标复杂场景的高效精准三维内容修改。
技术关键词
编辑方法
环视相机
融合全局
多视角
语义特征
场景
对齐模块
网格技术
注意力
方位角
DBSCAN算法
文本
基元
多组件
图像
对象
系统为您推荐了相关专利信息
智能视频分析方法
智能视频分析系统
图像增强
智能图像处理技术
深度Q网络
语义计算方法
计算机程序指令
主成分分析算法
因子
计算机程序产品
排险机器人
三维点云数据
语义特征
注意力机制
巡检机器人