一种音视频文件识别提取方法

正文

推荐专利

一种音视频文件识别提取方法

申请号：CN202510875908

申请日期：2025-06-27

公开号：CN120529107A

公开日期：2025-08-22

类型：发明专利

摘要

本申请公开了一种音视频文件识别提取方法，涉及图像处理领域，该方法包括对音视频文件进行解码，得到音频文件、视频文件和字幕文件；基于音频文件对字幕文件进行校验，根据解码准确性对视频文件进行视频帧提取，得到视频帧图像数据；对视频帧图像数据进行色彩划分，得到色彩图像数据；对色彩图像数据进行文字识别得到第一识别结果，对第一识别结果进行完整性判断，对不具有完整性的第一识别结果进行色彩图像数据选取和组合，并对组合后的色彩图像数据进行文字识别，得到第二识别结果，对第二识别结果进行完整性判断，直至识别结果具有完整性或不存在其他色彩图像数据为止。本申请具有提高文字识别准确性的效果。

技术关键词

视频帧识别提取方法色彩数据图像文字识别技术颜色字幕解码字体情景像素点对音视频关系机器学习算法标记图像处理

系统为您推荐了相关专利信息

空调的控制方法、装置、空调、存储介质以及程序产品

控制策略空调感知特征数据计算机程序产品

基于深度学习对医院采购发票的回款账期预测方法及系统

神经网络模型发票医院标签数据

面向目标检测任务的无人机跨模态语义通信方法及系统

信源信道联合编码预训练模型红外编码器通信方法跨模态

采购计划的打包方法、电子设备及计算机程序产品

打包方法节点计算机程序产品数据分析技术电子设备

样本统计训练神经网络的油气藏型储气库注采优化方法

油气藏型储气库深度神经网络模型神经网络参数训练深度神经网络遗传算法

一种音视频文件识别提取方法

站点导航

APP 下载