摘要
本发明公开了一种古籍数字的处理方法和装置。所述方法包括:基于第一尺寸对第一图像进行分割,确定第一识别结果;基于第二尺寸对第一图像进行分割,确定第二识别结果;确定第一识别结果和第二识别结果的关联集;获得去除关联集后的第二图像;基于第二图像内的像素获得第二图像内的若干像素空间分布;对像素空间分布进行聚类,获得像素空间分布的分类,其中,聚类的数目不低于图像内涉及的数学符号的数目;基于聚类结果获得像素空间分布对应的识别结果和无法识别的背景区域。
技术关键词
像素点
符号
尺寸
数学
重构
RNN神经网络
图像识别单元
图像获取单元
余弦算法
数据
聚类方法
字符
标记
间距
关系