一种基于渐进式优化网络的开放词汇点监督时序动作定位方法

正文

推荐专利

申请号：CN202510524968

申请日期：2025-04-24

公开号：CN120411855A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种基于渐进式优化网络的开放词汇点监督时序动作定位方法，属于视频理解领域。首先通过语义引导早期增强对视觉特征进行初步筛选，从而抑制背景噪声干扰，提升类别相关特征的表达能力。随后，利用上下文‑语义后期增强进一步建模动作在不同时间段之间的语义关联，强化视觉表达的类别辨识度，促使模型挖掘更多不受约束的新类提议。最后，结合伪标签约束优化动作边界，实现对边界位置的精细建模，在提升检测精度的同时增强模型的泛化能力。该方法结合渐进式优化建模策略，融合视觉与语义特征构建统一的渐进优化网络，旨在减少标记依赖的同时提升动作定位性能。所述方法在智能监控、异常行为检测、视频问答等任务中具备广泛的应用前景。

技术关键词

动作定位方法视觉特征特征提取模块视频语义特征抑制背景噪声注意力机制标签融合视觉时间段文本系统模块网络优化时序特征多阈值

系统为您推荐了相关专利信息

一种基于风险感知的自适应时序预测方法

时序预测方法高风险序列局部特征提取连续性

沉浸式全景教学培训系统和方法

多媒体显示设备教学培训系统情景人机交互设备界面

基于多模态大模型的图像检索方法、系统及电子设备

图像检索方法多模态图像检索系统图像特征提取索引算法

基于仿真场景生成的视觉感知算法精度优化方法及系统

仿真场景精度优化方法交通仿真视频流视觉

一种基于复杂环境的高保真音乐降噪方法及系统

噪声特征降噪方法降噪模型音乐特征提取模块

一种基于渐进式优化网络的开放词汇点监督时序动作定位方法

站点导航

APP 下载