摘要
本发明提供了一种扫描钻孔柱状图全要素信息自动识别提取方法,其包括:(1)初始化参数配置;(2)文字样本制作与模型训练,根据初始化参数中设置的字体信息批量生成对应文字样本,并训练优化OCR文字识别模型;(3)特殊符号样本制作;(4)钻孔柱状图全要素信息提取与处理;(5)制定钻孔柱状图全要素信息提取结果的结构化存储标准,并以XML文件格式保存。本发明构思合理,实现了钻孔柱状图全要素信息的一次性批量提取,且采用的深度学习算法可以有效提升文字、特殊符号等信息的准确性,建立了图面要素之间的位置关系,可保证钻孔柱状图的完整信息能够全面的记录在XML标记文本中,不丢失图面信息。
技术关键词
钻孔柱状图
样本
标尺
文本
深度学习识别模型
参数
OCR文字识别
批量
字体
图片
颜色分量值
坐标
边缘检测算法
像素点
格网
深度学习算法
识别模块
生成文字