摘要
本发明公开了一种基于图模型和多尺度注意力机制的视频摘要方法,本发明涉及计算机视觉技术领域。该基于图模型和多尺度注意力机制的视频摘要方法,通过引入多尺度注意力机制,将局部帧间关系的建模与全局长期依赖关系的建模分开进行,有效降低计算过程中注意力权重的偏差,同时,采用GATv2图注意力机制提取局部帧间的关联性,使用CLS标识符聚合全局特征信息,确保全局与局部信息的高效融合,并且利用非极大值抑制去除冗余帧,进一步提升视频摘要的质量,避免位置信息注入带来的冗余问题,实现更精准的帧间关系建模与视频内容摘要。
技术关键词
视频摘要方法
序列
多尺度注意力机制
非极大值抑制方法
特征提取模块
镜头
计算机视觉技术
背包算法
关键帧
冗余
视频帧
分支
节点
关系建模
抑制算法
令牌
系统为您推荐了相关专利信息
故障识别方法
跨模态
注意力机制
特征提取模块
数据
工业生产流程
工业生产系统
智能诊断方法
灰色关联度
参数
动物模型构建方法
酒精性脂肪性肝炎
治疗药物
基因
序列
电力负荷识别方法
数据缺失值
填充方法
有功功率
编码器
羊毛针织面料
指标
指数
初始聚类中心
灰色关联度