摘要
本发明公开了融合状态空间建模与语义引导的视频补全方法,涉及视频处理技术领域。本发明提出一种融合状态空间建模与语义引导机制的视频补全框架,命名为SAGE‑VI(State‑Aware and Guided Enhancement forVideo Inpainting),该框架由两个阶段组成:像素传播阶段与语义引导的参考生成阶段;在像素传播阶段,框架采用状态空间建模机制增强光流补全中的时序感知与结构一致性,从而提高像素传播的稳定性;在语义引导阶段,设计参考生成模块,结合图像特征构建区域级语义提示,引导缺失区域的内容生成,提升细节还原质量与语义合理性;在HQVI数据集上的实验结果表明,SAGE‑VI在定量指标和视觉质量方面均优于现有主流方法,验证了其在复杂场景下的补全性能与泛化能力。
技术关键词
视频补全方法
像素
图像融合策略
生成结构
序列
阶段
一致性检测
模块
图像生成器
有效性
融合语义
框架
时序
生成机制
矩阵
注意力机制
系统为您推荐了相关专利信息
柔性基板
LAB颜色空间
图像采集区域
线路
像素点
车辆显示装置
座舱控制器
图标
车辆状态信息
座舱系统