基于多模态模型的视频内容管理方法、计算机设备及介质

正文

推荐专利

申请号：CN202411705843

申请日期：2024-11-26

公开号：CN119622031A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种基于多模态模型的视频内容管理方法、计算机设备及介质，属于多媒体技术领域，所述基于多模态模型的视频内容管理方法从至少一个视频片段中抽取原始关键帧图片后，获取原始关键帧图片的时间戳、时间点，对原始关键帧图片去除重复的图片内容、删除无效的图片内容，再去除黑屏图片，通过CLIP模型进行向量化处理，得到向量化数据，进而执行自动语音识别，最后生成视频元数据。所述基于多模态模型的视频内容管理方法能提供基于图片或者文字的视频内容检索服务，实现视频的精细化管理，并提供基于帧级的视频内容检索，提升视频内容检索的准确度，支持海量视频内容的毫秒级检索。

技术关键词

视频内容管理方法关键帧图片多模态视频元数据语音识别文本执行自动语音识别计算机设备内容检索服务视频编码器 VAD算法识别算法分段可读存储介质直方图特征点音频编码

基于多模态模型的视频内容管理方法、计算机设备及介质

站点导航

APP 下载