多模态的视频摘要标记方法及相关设备

正文

推荐专利

多模态的视频摘要标记方法及相关设备

申请号：CN202510908862

申请日期：2025-07-01

公开号：CN120692445A

公开日期：2025-09-23

类型：发明专利

摘要

本申请的实施例提供了一种多模态的视频摘要标记方法及相关设备。该多模态的视频摘要标记方法包括：获取待标记视频的视频流信息和音频流信息；对视频流信息和音频流信息进行特征融合，得到统一嵌入向量；将统一嵌入向量输入摘要生成模型，得到视频摘要文本，视频摘要文本包括总结摘要文本以及分段摘要文本；将各分段摘要文本标记于对应的视频段中，得到已标记视频段；将总结摘要文本标记于待标记视频上，得到已标记视频。本申请实施例的技术方案通过特征融合，视频和音频信息能够在统一的向量空间中进行处理，避免了信息丢失，提高了信息融合的准确性和完整性。

技术关键词

摘要标记方法视频段文本视频流分段多模态音频标记装置视觉特征语义特征网络处理器事件识别计算机程序产品模块存储装置分支

系统为您推荐了相关专利信息

一种基于知识图谱的新闻分类方法、装置、设备、介质

新闻分类方法构建知识图谱三元组学生网络

一种基于空间感知依赖图和无损解码的联合信息抽取方法

事件触发器前馈神经网络标签节点联合信息抽取方法

文本识别方法、装置、计算机设备、存储介质和计算机程序产品

文本识别模型训练样本图像视觉特征提取网络文本识别方法

用于视频流的AI文本

文本图像生成代码标志计算机

一种数据传输方法、装置、介质及设备

密钥基站摘要通信状态信息对称密码算法

多模态的视频摘要标记方法及相关设备

站点导航

APP 下载