视频信息摘要生成方法、装置、电子装置和存储介质

正文

推荐专利

申请号：CN202410920291

申请日期：2024-07-10

公开号：CN118467778B

公开日期：2024-10-18

类型：发明专利

摘要

本申请涉及一种视频信息摘要生成方法、装置、电子装置和存储介质，其中，该视频信息摘要生成方法包括：获取初始视频和预设的针对目标对象的文字描述；将初始视频和文字描述输入至训练后的开放世界目标检测模型进行关键帧检测，得到初始视频中包含目标对象的关键帧；对若干帧的关键帧进行聚类，得到初始视频信息摘要；将初始视频信息摘要输入至图片‑文本提取单元提取文本描述，得到初始视频信息摘要的图片文本描述；将初始视频信息摘要的图片文本描述与初始视频信息摘要输入至视频‑文本语义对齐单元进行语义对齐，得到对齐后的视频特征表示；将对齐后的视频特征表示输入至文本生成单元，得到目标视频信息摘要。提高了文本摘要内容的正确性。

技术关键词

摘要生成方法视频关键帧文本生成器图片聚类对齐模块摘要生成装置电子装置语义网络对象 K近邻图文处理器度量可读存储介质

系统为您推荐了相关专利信息

视频理解方法、装置、电子设备、存储介质及程序产品

镜头关键帧视频理解方法运动分析方法

一种多源信息融合的室外巡检场景三维彩色几何模型重建方法

运动主体巡检场景三维彩色点云模型重建方法激光雷达

一种基于深度学习的大熊猫行为识别方法及系统

动作特征语义特征提取融合特征注意力机制空间特征信息

一种提效单视频3DGS人头重建的高斯球更新方法及装置

三角形面片更新方法点云三维位置信息计算机可执行程序

基于图像增强和多尺度学习的复杂光线下的行人检测方法

行人检测方法图像增强网络注意力机制金字塔池化多尺度信息

视频信息摘要生成方法、装置、电子装置和存储介质

站点导航

APP 下载