一种音视频文件识别提取方法

AITNT
正文
推荐专利
一种音视频文件识别提取方法
申请号:CN202510875908
申请日期:2025-06-27
公开号:CN120529107A
公开日期:2025-08-22
类型:发明专利
摘要
本申请公开了一种音视频文件识别提取方法,涉及图像处理领域,该方法包括对音视频文件进行解码,得到音频文件、视频文件和字幕文件;基于音频文件对字幕文件进行校验,根据解码准确性对视频文件进行视频帧提取,得到视频帧图像数据;对视频帧图像数据进行色彩划分,得到色彩图像数据;对色彩图像数据进行文字识别得到第一识别结果,对第一识别结果进行完整性判断,对不具有完整性的第一识别结果进行色彩图像数据选取和组合,并对组合后的色彩图像数据进行文字识别,得到第二识别结果,对第二识别结果进行完整性判断,直至识别结果具有完整性或不存在其他色彩图像数据为止。本申请具有提高文字识别准确性的效果。
技术关键词
视频帧 识别提取方法 色彩 数据 图像文字识别技术 颜色 字幕 解码 字体 情景 像素点 对音视频 关系 机器学习算法 标记 图像处理
系统为您推荐了相关专利信息
1
空调的控制方法、装置、空调、存储介质以及程序产品
控制策略 空调 感知特征 数据 计算机程序产品
2
基于深度学习对医院采购发票的回款账期预测方法及系统
神经网络模型 发票 医院 标签 数据
3
面向目标检测任务的无人机跨模态语义通信方法及系统
信源信道联合编码 预训练模型 红外编码器 通信方法 跨模态
4
采购计划的打包方法、电子设备及计算机程序产品
打包方法 节点 计算机程序产品 数据分析技术 电子设备
5
样本统计训练神经网络的油气藏型储气库注采优化方法
油气藏型储气库 深度神经网络模型 神经网络参数 训练深度神经网络 遗传算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号