摘要
本发明公开了一种基于双阶段神经网络的点监督时序动作定位方法及系统。该方法包括:首先针对点监督标注的时序动作定位数据集,通过I3D视频特征提取网络提取每个动作视频的视频特征;然后对候选提案生成模块进行第一阶段的帧级原型学习,以及对边界定位模块进行第二阶段的实例级边界学习;最后,针对目标动作视频,将其通过I3D视频特征提取网络提取视频特征后输入经过学习的候选提案生成模块,生成所有候选提案后输入经过学习的边界定位模块,对得到的所有修正后提案计算提案分数并执行soft‑NMS算法,获得最终提案。本发明可有效区分视频中的背景和动作,同时提取视频全局的动作特征。以实现人体时序动作定位,提高定位精确度。
技术关键词
动作定位方法
原型
视频特征提取
定位模块
时序
时间序列特征
分支
融合特征
阶段
动作定位系统
计算机电子设备
注意力机制
前馈神经网络
存储计算机程序
动作特征
系统为您推荐了相关专利信息
全光谱
趋势预测方法
趋势预测模型
多尺度注意力机制
长短期记忆网络
时序特征
车辆轨迹预测方法
交互特征
融合特征
注意力机制
分支指令
分支预测方法
程序计数器
原型
基础网络架构
电缆缺陷
传输线
定位方法
缺陷定位技术
电缆线芯
家庭服务机器人
大语言模型
多模态
视觉特征
文本编码器