摘要
本申请公开了一种音视频文件识别提取方法,涉及图像处理领域,该方法包括对音视频文件进行解码,得到音频文件、视频文件和字幕文件;基于音频文件对字幕文件进行校验,根据解码准确性对视频文件进行视频帧提取,得到视频帧图像数据;对视频帧图像数据进行色彩划分,得到色彩图像数据;对色彩图像数据进行文字识别得到第一识别结果,对第一识别结果进行完整性判断,对不具有完整性的第一识别结果进行色彩图像数据选取和组合,并对组合后的色彩图像数据进行文字识别,得到第二识别结果,对第二识别结果进行完整性判断,直至识别结果具有完整性或不存在其他色彩图像数据为止。本申请具有提高文字识别准确性的效果。
技术关键词
视频帧
识别提取方法
色彩
数据
图像文字识别技术
颜色
字幕
解码
字体
情景
像素点
对音视频
关系
机器学习算法
标记
图像处理
系统为您推荐了相关专利信息
信源信道联合编码
预训练模型
红外编码器
通信方法
跨模态
打包方法
节点
计算机程序产品
数据分析技术
电子设备
油气藏型储气库
深度神经网络模型
神经网络参数
训练深度神经网络
遗传算法