摘要
本发明属于计算机视觉及图像处理领域,涉及采用深度卷积神经网络对视频进行细粒度的行为识别,具体涉及基于属性引导的细粒度视频行为识别方法。本发明程序简单,易于实现,能够识别人体和机械设备细粒度的动作,提出将原子属性作为主要线索以更好地理解复杂的人体动作和机械臂动作。此外,本方法对视频和文本的特征进行多步处理,生成语义嵌入,并且在语义空间上进一步约束预测结果。
技术关键词
识别方法
原型
标记
文本编码器
视频编码器
密度峰值聚类算法
样本
深度卷积神经网络
语义
标签
识别人体
多层感知机
计算机视觉
K近邻
异常状态
数据