摘要
本发明实施例公开了基于多模态算法的书本CI P检测识别优化方法及系统。所述方法包括:获取待识别书本图像;对所述待识别书本图像进行预处理,以得到预处理结果;对所述预处理结果进行书本CIP区域检测,以得到检测结果;将所述检测结果输入至文本识别模型内进行书本基础信息识别,以得到识别结果;对所述识别结果进行后处理优化,以得到优化结果;输出所述优化结果。通过实施本发明实施例的方法可实现精准定位书本中的CIP区域,从而提高整体识别准确度。
技术关键词
识别优化方法
书本
多模态
文本识别模型
YOLO算法
检测模型训练
图像获取单元
语法结构
样本
字体
多语言
光照
基础
校正
系统为您推荐了相关专利信息
融合图像数据
重构图像块
多模态图像数据
衍射光学结构
感兴趣
塑料包装桶
可见光图像
轮廓特征
反射噪声
热图像
脑胶质瘤
基因分型方法
图像嵌入
联合损失函数
图像编码器