摘要
本申请涉及长持续时间结构化视频动作分割。机器学习模型可以处理视频并且生成输出,例如将视频的一些部分指派给特定动作的动作分割,或者为视频的每一帧指派动作类别的动作分类。一些机器学习模型可以对短视频准确地作出预测,但可能并不特别适合对长持续时间、结构化的视频执行动作分割。一种有效的机器学习模型可以包括一种涉及时间卷积网络和双向图神经网络的混合体系结构。机器学习模型可以通过以下方式来处理长持续时间结构化视频:使用时间卷积网络作为第一道动作分割模型来生成丰富的帧级特征。帧级特征可以被转换为具有前向边缘和后向边缘的图。图神经网络可以对图进行处理,以细化最终的细粒度每帧动作预测。
技术关键词
时间卷积网络
机器学习模型
三维卷积神经网络
视频帧
节点
非暂态计算机可读介质
序列
混合体系结构
指派
加法器
内核
转换器
处理器
存储设备
阶段
指令
消息
系统为您推荐了相关专利信息
混合预测模型
患者健康管理
融合多源数据
健康风险预测
患者生理数据
神经网络建模方法
通信网络拓扑
时空大数据
网络功能实体
顶点
动态障碍物
速度估计
节点
栅格地图
激光雷达点云数据