一种基于图模型和多尺度注意力机制的视频摘要方法

AITNT
正文
推荐专利
一种基于图模型和多尺度注意力机制的视频摘要方法
申请号:CN202510153403
申请日期:2025-02-12
公开号:CN120050491A
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于图模型和多尺度注意力机制的视频摘要方法,本发明涉及计算机视觉技术领域。该基于图模型和多尺度注意力机制的视频摘要方法,通过引入多尺度注意力机制,将局部帧间关系的建模与全局长期依赖关系的建模分开进行,有效降低计算过程中注意力权重的偏差,同时,采用GATv2图注意力机制提取局部帧间的关联性,使用CLS标识符聚合全局特征信息,确保全局与局部信息的高效融合,并且利用非极大值抑制去除冗余帧,进一步提升视频摘要的质量,避免位置信息注入带来的冗余问题,实现更精准的帧间关系建模与视频内容摘要。
技术关键词
视频摘要方法 序列 多尺度注意力机制 非极大值抑制方法 特征提取模块 镜头 计算机视觉技术 背包算法 关键帧 冗余 视频帧 分支 节点 关系建模 抑制算法 令牌
系统为您推荐了相关专利信息
1
基于跨模态融合的通信故障识别方法、装置及电子设备
故障识别方法 跨模态 注意力机制 特征提取模块 数据
2
一种流程工业生产系统能效评价与智能诊断方法
工业生产流程 工业生产系统 智能诊断方法 灰色关联度 参数
3
APP在非酒精性脂肪性肝炎中的应用
动物模型构建方法 酒精性脂肪性肝炎 治疗药物 基因 序列
4
一种基于迁移学习的电力负荷识别方法与系统
电力负荷识别方法 数据缺失值 填充方法 有功功率 编码器
5
一种羊毛针织面料透气性数字化预测方法及系统
羊毛针织面料 指标 指数 初始聚类中心 灰色关联度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号