一种图像多语种文字识别的部署方法和系统

正文

推荐专利

一种图像多语种文字识别的部署方法和系统

申请号：CN202411919018

申请日期：2024-12-25

公开号：CN119863797A

公开日期：2025-04-22

类型：发明专利

摘要

本发明公开的一种图像多语种文字识别的部署方法和系统，属于计算机视觉和模式识别技术领域。本发明实现方法为：1、构建文本检测ensemble模型；利用文本检测ensemble模型将待处理的二进制图片转化为文本块；2、构建语种分类ensemble模型；利用语种分类ensemble模型对文本块进行动态批处形成文本块的语种类别；3、构建文本识别ensemble模型；利用文本识别ensemble模型对文本块进行动态批处理解析形成文本。与现有技术相比，本发明通过将每个子模块的深度学习模型和前、后处理模块集成到一个ensemble模型中提高了串行效率，并通过对深度学习模型配置动态批处理，将多个推理请求组合成单个批处理；对前、后处理模块启动多个实例，在图像多语种文字识别中提升OCR推理服务对GPU的利用率。

技术关键词

后处理模块文本识别图片图像深度学习模型模式识别技术动态数据解码计算机视觉子模块

系统为您推荐了相关专利信息

一种基于锥束-平行束重排的多源CT重建方法

锥束探测器残差结构联合双边滤波射线源

一种远距离成像中的大气湍流波前相因子估计方法

双生成对抗网络生成器网络湍流因子估计方法

软件作业能耗预测方法、装置、电子设备及存储介质

能耗预测方法深度学习模型时间预测模型集群软件

一种数字化土地规划信息数据管理方法及系统

地形特征地形结构土地利用分类植被管理策略

一种缺陷检测方法、装置及设备

深度学习模型深度卷积神经网络模型样本缺陷检测方法数据

一种图像多语种文字识别的部署方法和系统

站点导航

APP 下载