摘要
本发明提供了一种基于面向对象的层次化记忆网络装置,包括:低级别对象感知模块、时空记忆构建模块和长期时空记忆建模模块;所述低级别对象感知模块,用于通过分割基础模型提取输入视频的对象特征;所述时空记忆构建模块,用于通过分析帧间空间和时间关系,提取对象交互和场景的信息,从而将对象特征与输入的原始视频帧进行拼接,生成目标感知的空间表示;所述长期时空记忆建模模块,用于通过记忆库存储历史信息,捕捉视频级别的全局依赖关系,将时空记忆构建模块输出的多个相邻视频帧在通道维度上进行拼接,以形成局部多帧时空表示。达到增强模型对长视频中细粒度时空动态的捕捉能力的目的。
技术关键词
层次化记忆网络
存储历史信息
模块
对象交互
视频帧
训练图像模型
通道
时序
视觉特征
策略
关系
基础
场景
代表
编码
动态
系统为您推荐了相关专利信息
三维仿真模型
模拟仿真方法
对象
美容整形技术
模拟仿真装置
环境调控方法
远程监控平台
环境调控设备
调控策略
光照调节设备
电磁式换能器
开关器件
栅极控制信号
门控循环单元
充电控制模块