摘要
本发明涉及视频分析技术领域,具体公开了一种基于AI智慧视频分析方法及系统,所述方法包括对所述待识别视频进行切分,得到基于同一时间轴的音频信息和图像序列;对所述音频信息进行识别,对图像序列进行初次分组,对初次分组后的每一组图像进行组内比对,根据比对结果进行二次分组,得到最终的图像组;所述图像组是图像的集合,图像组中含有基于时间轴生成的时间标签;在每个图像组中抽取至少一张图像,对该图像进行识别,生成评价文本。本发明在视频文件中抽取部分图像,借助基于AI的固定识别方案和基于本地模型的动态识别方案对图像进行分析,可以极快地将视频转换为文本,便于用户快速了解视频内容。
技术关键词
视频分析方法
音频
训练神经网络模型
统计语言模型
视频分析系统
语句
样本
图像识别模块
序列
文本
图像读取单元
视频分析技术
分段
动态
轨道
标签
分析单元
系统为您推荐了相关专利信息
情绪识别方法
视频特征向量
声谱
交互注意力
波形