摘要
本发明公开的一种图像多语种文字识别的部署方法和系统,属于计算机视觉和模式识别技术领域。本发明实现方法为:1、构建文本检测ensemble模型;利用文本检测ensemble模型将待处理的二进制图片转化为文本块;2、构建语种分类ensemble模型;利用语种分类ensemble模型对文本块进行动态批处形成文本块的语种类别;3、构建文本识别ensemble模型;利用文本识别ensemble模型对文本块进行动态批处理解析形成文本。与现有技术相比,本发明通过将每个子模块的深度学习模型和前、后处理模块集成到一个ensemble模型中提高了串行效率,并通过对深度学习模型配置动态批处理,将多个推理请求组合成单个批处理;对前、后处理模块启动多个实例,在图像多语种文字识别中提升OCR推理服务对GPU的利用率。
技术关键词
后处理模块
文本识别
图片
图像
深度学习模型
模式识别技术
动态
数据解码
计算机视觉
子模块
系统为您推荐了相关专利信息
能耗预测方法
深度学习模型
时间预测模型
集群
软件
深度学习模型
深度卷积神经网络模型
样本
缺陷检测方法
数据