基于动态帧选择的分镜视频理解方法、装置、设备及介质

正文

推荐专利

申请号：CN202411909212

申请日期：2024-12-24

公开号：CN119832476A

公开日期：2025-04-15

类型：发明专利

摘要

本发明提供的基于动态帧选择的分镜视频理解方法、装置、设备及介质，涉及视频理解领域。本发明使用卷积神经网络从获取的分镜视频的每一帧中提取出特征向量；选取两种聚类算法进行聚类分析，得到两种聚类结果；根据两种聚类结果创建对应的共识矩阵，并进行元素数值相加，得到融合共识矩阵；采用预设阈值，对融合共识矩阵进行分类，然后在每个类别中，计算连续帧间的特征向量值差异，选取差异值排名前二的两帧作为对应类别的代表帧；结合代表帧与视频首帧，计算出权重，得到视觉特征表示；将分镜视频的语音转换为文本，并结合视觉特征表示，通过深度学习算法进行特征提取与融合，得到分镜视频的理解文案。本发明能有效提升分镜视频理解的准确性。

技术关键词

视频理解方法视觉特征特征向量值深度学习算法矩阵计算机可读指令代表动态可读存储介质层次聚类算法特征提取单元数值文本语音处理器存储器

系统为您推荐了相关专利信息

一种硅胶材料仓储中心库存监测管理系统

硅胶材料监测管理系统转移概率矩阵指数需求预测模型

一种基于DeepSORT的自适应车辆轨迹跟踪算法

车辆轨迹跟踪卡尔曼滤波 Kalman滤波算法车辆跟踪方法

一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统

排序算法微观分析方法计算机设备指标网络

基于双向概念感知的组合零样本学习的图像识别方法及设备

图像对象特征图像识别模型图像识别方法概念视觉特征

基于视觉注意力增强的任务处理方法、装置、设备及介质

注意力高层视觉特征分支跨模态多模态

基于动态帧选择的分镜视频理解方法、装置、设备及介质

站点导航

APP 下载