多模态的视频摘要标记方法及相关设备

AITNT
正文
推荐专利
多模态的视频摘要标记方法及相关设备
申请号:CN202510908862
申请日期:2025-07-01
公开号:CN120692445A
公开日期:2025-09-23
类型:发明专利
摘要
本申请的实施例提供了一种多模态的视频摘要标记方法及相关设备。该多模态的视频摘要标记方法包括:获取待标记视频的视频流信息和音频流信息;对视频流信息和音频流信息进行特征融合,得到统一嵌入向量;将统一嵌入向量输入摘要生成模型,得到视频摘要文本,视频摘要文本包括总结摘要文本以及分段摘要文本;将各分段摘要文本标记于对应的视频段中,得到已标记视频段;将总结摘要文本标记于待标记视频上,得到已标记视频。本申请实施例的技术方案通过特征融合,视频和音频信息能够在统一的向量空间中进行处理,避免了信息丢失,提高了信息融合的准确性和完整性。
技术关键词
摘要 标记方法 视频段 文本 视频流 分段 多模态 音频 标记装置 视觉特征 语义特征 网络 处理器 事件识别 计算机程序产品 模块 存储装置 分支
系统为您推荐了相关专利信息
1
一种基于知识图谱的新闻分类方法、装置、设备、介质
新闻分类方法 构建知识图谱 三元组 学生 网络
2
一种基于空间感知依赖图和无损解码的联合信息抽取方法
事件触发器 前馈神经网络 标签 节点 联合信息抽取方法
3
文本识别方法、装置、计算机设备、存储介质和计算机程序产品
文本识别模型 训练样本图像 视觉特征提取 网络 文本识别方法
4
用于视频流的AI文本
文本 图像 生成代码 标志 计算机
5
一种数据传输方法、装置、介质及设备
密钥 基站 摘要 通信状态信息 对称密码算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号