针对视频中字幕的OCR识别系统

AITNT
正文
推荐专利
针对视频中字幕的OCR识别系统
申请号:CN202410718493
申请日期:2024-06-04
公开号:CN118429987A
公开日期:2024-08-02
类型:发明专利
摘要
本发明属于OCR识别系统技术领域,且公开了针对视频中字幕的OCR识别系统,具体步骤如下:步骤一:文字检测模块OCR的文字检测部分主要使用了DBNet模型。通过第一次版面分析能够大致确定字幕的位置并且向上下扩展,通过判断是否有字幕,从而节省了算力,通过第一次版面分析获取字幕的大体位置,为第二次版面分析提供基础,第二次版面分析通过结合OCR识别结果以及去除字符等干扰信息和对同一水平区域文字检测结果的合并,有效减少了误识别,提高了字幕识别的准确性,再通过训练LR模型准确判断是否为字幕,进一步提高了字幕识别的准确性,准确获取了字幕的位置,最后通过去除水印字幕和将文本区域相近的文字合并。
技术关键词
字幕 识别系统 视频 水印 文本 字符 图像 颜色 模块 坐标 注意力 字体 粗略 标志 符号 光照 数据 场景 算法 基础
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号