基于切换感知和理解的多镜头视频目标分割方法及系统

AITNT
正文
推荐专利
基于切换感知和理解的多镜头视频目标分割方法及系统
申请号:CN202511117816
申请日期:2025-08-11
公开号:CN121010610A
公开日期:2025-11-25
类型:发明专利
摘要
本发明提供了一种基于切换感知和理解的多镜头视频目标分割方法及系统,属于人工智能中的计算机视觉领域。本发明通过建构镜头切换检测和理解模块,改进SAM2模型,将视频目标分割方法泛化至包含多个镜头的复杂视频下,充分提升了模型的跨镜头追踪和分割能力。通过引入局部记忆库,通过无监督的方式迫使模型捕捉和记忆物体局部细节信息,从而更容易在切换前后寻找到关键性的可靠匹配线索,有效提高了物体匹配成功率。本发明能够在剪辑后的复杂多镜头视频内进行高精度的一致性分割,适应于多种不同切换类型,能够在现存多数视频上进行稳定可靠的高精度分割,在多领域下具有应用价值和广泛的研究前景。
技术关键词
分割方法 记忆 镜头 视频 注意力 多层感知机 物体 无监督 误差函数 视觉特征 生成树 解码器 序列 语义 场景 分割系统 计算机视觉 模块 邻域 关键性
系统为您推荐了相关专利信息
1
基于生理信号的小儿呼吸异常检测方法及系统
呼吸异常检测方法 信号 李雅普诺夫指数 多模态生理 非线性特征
2
一种结合车网互动的虚拟电厂优化调度方法、系统、设备及介质
虚拟电厂优化调度方法 分布式电源 可控负荷用电需求 储能系统充放电 发电量
3
一种音频分离方法、装置、电子设备及存储介质
音频 时序特征 残差神经网络 样本 序列
4
一种自感知刚柔切换机械臂关节及三维重建方法
机械臂关节 三维重建模型 三维重建方法 电阻式应变传感器 碳纳米管复合材料
5
一种精准控温负压吸附经穴透皮导入方法及装置
红外加热装置 电加热装置 历史温度数据 压强 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号