摘要
本发明提供了一种快速的全景视频显著性预测方法,首先将全景视频处理为视频帧,将连续的视频帧作为输入。针对全景视频视场范围大,内容复杂的问题,设计了两阶段级联方法,首先通过基础视觉特征提取模块对输入帧序列进行多尺度语义特征提取,快速提取有用信息,过滤背景信息,随后通过时空解耦模块以串行的方式分别提取连续帧的时间特征及空间特征,然后通过双分支注意力先验模块生成赤道先验和空间语义集成先验来模拟全景视频观看行为中的视觉偏置现象,最后将时空特征和先验特征进行融合,使用时序关系建模模块处理连续视频帧之间的时序关系并生成最终的显著图。
技术关键词
全景视频
显著性预测方法
视觉特征提取
残差网络
注意力先验
视频帧
模块
上采样
关系建模
双线性插值方法
空洞
采样率
语义特征提取
通道
级联方法
时序
柱状
多尺度
系统为您推荐了相关专利信息
医学图像分类
图像识别方法
残差网络
网络架构
眼科
电气控制电路
诊断系统
学习控制器
在线增量学习
机械特征
监测方法
数据采集平台
数据中心
跨模态
融合特征
网页动态内容
篡改检测方法
页面特征
多模态
快照