摘要
本发明提供了一种基于切换感知和理解的多镜头视频目标分割方法及系统,属于人工智能中的计算机视觉领域。本发明通过建构镜头切换检测和理解模块,改进SAM2模型,将视频目标分割方法泛化至包含多个镜头的复杂视频下,充分提升了模型的跨镜头追踪和分割能力。通过引入局部记忆库,通过无监督的方式迫使模型捕捉和记忆物体局部细节信息,从而更容易在切换前后寻找到关键性的可靠匹配线索,有效提高了物体匹配成功率。本发明能够在剪辑后的复杂多镜头视频内进行高精度的一致性分割,适应于多种不同切换类型,能够在现存多数视频上进行稳定可靠的高精度分割,在多领域下具有应用价值和广泛的研究前景。
技术关键词
分割方法
记忆
镜头
视频
注意力
多层感知机
物体
无监督
误差函数
视觉特征
生成树
解码器
序列
语义
场景
分割系统
计算机视觉
模块
邻域
关键性
系统为您推荐了相关专利信息
呼吸异常检测方法
信号
李雅普诺夫指数
多模态生理
非线性特征
虚拟电厂优化调度方法
分布式电源
可控负荷用电需求
储能系统充放电
发电量
机械臂关节
三维重建模型
三维重建方法
电阻式应变传感器
碳纳米管复合材料
红外加热装置
电加热装置
历史温度数据
压强
神经网络模型