摘要
本发明属于OCR识别系统技术领域,且公开了针对视频中字幕的OCR识别系统,具体步骤如下:步骤一:文字检测模块OCR的文字检测部分主要使用了DBNet模型。通过第一次版面分析能够大致确定字幕的位置并且向上下扩展,通过判断是否有字幕,从而节省了算力,通过第一次版面分析获取字幕的大体位置,为第二次版面分析提供基础,第二次版面分析通过结合OCR识别结果以及去除字符等干扰信息和对同一水平区域文字检测结果的合并,有效减少了误识别,提高了字幕识别的准确性,再通过训练LR模型准确判断是否为字幕,进一步提高了字幕识别的准确性,准确获取了字幕的位置,最后通过去除水印字幕和将文本区域相近的文字合并。
技术关键词
字幕
识别系统
视频
水印
文本
字符
图像
颜色
模块
坐标
注意力
字体
粗略
标志
符号
光照
数据
场景
算法
基础