一种图像多语种文字识别的部署方法和系统

AITNT
正文
推荐专利
一种图像多语种文字识别的部署方法和系统
申请号:CN202411919018
申请日期:2024-12-25
公开号:CN119863797A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开的一种图像多语种文字识别的部署方法和系统,属于计算机视觉和模式识别技术领域。本发明实现方法为:1、构建文本检测ensemble模型;利用文本检测ensemble模型将待处理的二进制图片转化为文本块;2、构建语种分类ensemble模型;利用语种分类ensemble模型对文本块进行动态批处形成文本块的语种类别;3、构建文本识别ensemble模型;利用文本识别ensemble模型对文本块进行动态批处理解析形成文本。与现有技术相比,本发明通过将每个子模块的深度学习模型和前、后处理模块集成到一个ensemble模型中提高了串行效率,并通过对深度学习模型配置动态批处理,将多个推理请求组合成单个批处理;对前、后处理模块启动多个实例,在图像多语种文字识别中提升OCR推理服务对GPU的利用率。
技术关键词
后处理模块 文本识别 图片 图像 深度学习模型 模式识别技术 动态 数据解码 计算机视觉 子模块
系统为您推荐了相关专利信息
1
一种基于锥束-平行束重排的多源CT重建方法
锥束 探测器 残差结构 联合双边滤波 射线源
2
一种远距离成像中的大气湍流波前相因子估计方法
双生成对抗网络 生成器网络 湍流 因子 估计方法
3
软件作业能耗预测方法、装置、电子设备及存储介质
能耗预测方法 深度学习模型 时间预测模型 集群 软件
4
一种数字化土地规划信息数据管理方法及系统
地形特征 地形结构 土地利用分类 植被 管理策略
5
一种缺陷检测方法、装置及设备
深度学习模型 深度卷积神经网络模型 样本 缺陷检测方法 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号