摘要
本发明涉及计算机视觉技术领域,解决现有技术中如何提高帧间信息的稳定性和视频转场识别的准确性的问题,提供了基于单目深度场的视频转场识别方法、装置、设备及介质。该方法包括:对待转场识别的视频流进行预处理,得到若干帧第一视频图像;对各所述第一视频图像进行单目深度场计算,获取若干帧第二深度场图像;根据各所述第二深度场图像,判断是否发生了视频转场,得到视频转场判断结果。本发明采用先进的单目视觉算法评估每一帧的深度图,并通过比较连续帧的深度场差异,自动标定出视频中的转场位置,减少了人工检查的需求,提高了视频编辑的自动化水平和编辑效率,为专业及业余视频制作者提供了强有力的技术支持。
技术关键词
场图像
识别方法
计算机程序指令
二值化图像
视频流
计算机视觉技术
模糊阈值
视频编辑
视觉算法
识别装置
处理器
深度图
存储器
像素
坐标
电子设备
模块
介质
系统为您推荐了相关专利信息
语义分割方法
车道
神经网络模型
编码器模块
矩阵
医学图像识别方法
图像识别模型
标签特征
多标签
图像训练样本