摘要
本申请公开了一种文件数据的处理的方法、装置、设备及计算机存储介质,应用于图像处理领域。该方法对初始文件和目标文件进行文字识别,得到与初始文件和目标文件分别对应的多个识别文本块。基于多个识别文本块对应的位置信息,对位于同一行的多个识别文本块进行合并,得到与初始文件和目标文件对应的横向文本。基于多个识别文本块对应的位置信息,根据多个识别文本块相邻两行的第一分隔符的数量与预设数量阈值的第一比较结果,对位于同一列的多个识别文本块合并,得到与初始文件和目标文件对应的纵向文本。本公开通过获取横向文本和纵向文本,能够确定初始文件和目标文件在行和列上的差异,从而提高文件对比的准确性。
技术关键词
识别文本块
文本行
计算机程序指令
语句
字符
计算机存储介质
语义
识别模块
可读存储介质
数据
计算机程序产品
像素
处理器
颜色
图像处理
符号
存储器
系统为您推荐了相关专利信息
综合病症
机器学习模型
超声波
非易失性计算机可读存储介质
数据
语句
漏洞检测方法
大语言模型
遗传算法优化
编码向量
时间序列特征
注意力机制
前馈神经网络
编码器模块
解码器