基于切换感知和理解的多镜头视频目标分割方法及系统

正文

推荐专利

申请号：CN202511117816

申请日期：2025-08-11

公开号：CN121010610A

公开日期：2025-11-25

类型：发明专利

摘要

本发明提供了一种基于切换感知和理解的多镜头视频目标分割方法及系统，属于人工智能中的计算机视觉领域。本发明通过建构镜头切换检测和理解模块，改进SAM2模型，将视频目标分割方法泛化至包含多个镜头的复杂视频下，充分提升了模型的跨镜头追踪和分割能力。通过引入局部记忆库，通过无监督的方式迫使模型捕捉和记忆物体局部细节信息，从而更容易在切换前后寻找到关键性的可靠匹配线索，有效提高了物体匹配成功率。本发明能够在剪辑后的复杂多镜头视频内进行高精度的一致性分割，适应于多种不同切换类型，能够在现存多数视频上进行稳定可靠的高精度分割，在多领域下具有应用价值和广泛的研究前景。

技术关键词

分割方法记忆镜头视频注意力多层感知机物体无监督误差函数视觉特征生成树解码器序列语义场景分割系统计算机视觉模块邻域关键性

系统为您推荐了相关专利信息

基于生理信号的小儿呼吸异常检测方法及系统

呼吸异常检测方法信号李雅普诺夫指数多模态生理非线性特征

一种结合车网互动的虚拟电厂优化调度方法、系统、设备及介质

虚拟电厂优化调度方法分布式电源可控负荷用电需求储能系统充放电发电量

一种音频分离方法、装置、电子设备及存储介质

音频时序特征残差神经网络样本序列

一种自感知刚柔切换机械臂关节及三维重建方法

机械臂关节三维重建模型三维重建方法电阻式应变传感器碳纳米管复合材料

一种精准控温负压吸附经穴透皮导入方法及装置

红外加热装置电加热装置历史温度数据压强神经网络模型

基于切换感知和理解的多镜头视频目标分割方法及系统

站点导航

APP 下载