摘要
本发明提供了基于点云引导的三维场景视频编辑方法,包括:获取三维场景的原始视频,估计视频的指定帧中场景的三维点云及各视频帧的相机参数;根据指定帧的图像、像素级的掩码和编辑区描述文本,确定指定帧的编辑参考图像;根据编辑参考图像估计指定帧的编辑后深度,得到指定帧对应的编辑后三维点云;根据指定帧的掩码、指定帧的图像对应的编辑前深度图和编辑后深度图,构建用于包围编辑区的三维网格模型,利用三维网格模型将指定帧的掩码传递到其他帧视角下,得到其他帧的掩码;获取根据编辑后三维点云和每帧的相机参数渲染出的每帧的点云渲染图,根据每帧的点云渲染图、图像和掩码以及编辑参考图像,生成每帧的图像编辑结果,拼接为编辑后视频。
技术关键词
三维网格模型
视频编辑方法
视频生成模型
图像编辑工具
融合深度图
相机
变换器
控制模块
点云
深度值
场景
像素
缩放参数
图像编码
注意力机制
系统为您推荐了相关专利信息
全过程监控系统
拆除作业
三角剖分算法
可视化模块
生成作业
信号特征
视频生成方法
文本
空间结构信息
计算机可执行指令
三维网格模型
反演速度模型
震源
叠前深度偏移
生成地震波
栅格地图
消毒方法
动态物体
雷达点云数据
消毒机器人
风险检测方法
火灾
三维网格模型
指数
动态加密技术