一种基于多模态建立视频监控流式音视频存储语义索引的方法

正文

推荐专利

申请号：CN202411371008

申请日期：2024-09-29

公开号：CN119293292A

公开日期：2025-01-10

类型：发明专利

摘要

本发明提供一种基于多模态建立视频监控流式音视频存储语义索引的方法，属于音视频处理领域；解决了音视频转语义索引效率低的问题；具体如下：步骤S1：获取待提取图像、待提取音频和文本信息；步骤S2：提取待提取图像的图像特征集，提取待提取音频的语音特征集；步骤S3：融合图像特征集和语音特征集得到融合特征；根据融合特征对待提取图像和待提取音频进行归纳和分类，并结合文本信息建立语义标注；步骤S4：汇总语义标注，并反馈；本发明通过对音视频进行获取、处理和汇总，建立语义索引，提高音视频转语义索引的效率。

技术关键词

音视频图像特征集多模态语音特征语义音频离散余弦变换索引图片灰度共生矩阵融合特征表达式文本颜色轮廓像素点

系统为您推荐了相关专利信息

基于二手电子设备的数据处理方法、装置和计算机设备

注意力电子设备积层数据处理方法屏幕划痕

多模态融合的工业机械臂目标实时识别方法

工业机械臂图像采集装置主动识别系统传送带可见光图像

一种电力信息多模态数据动态集成方法及系统

动态集成方法冗余特征异构特征融合特征轮廓面积

一种基于AI驱动的多模态影像放疗引导方法

训练数据量影像异常状态 CT扫描图像覆盖率

基于跨模态耦合的民机PHM模型建模方法、介质和设备

模型建模方法跨模态模式特征向量物理数字孪生

一种基于多模态建立视频监控流式音视频存储语义索引的方法

站点导航

APP 下载