摘要
本申请实施例提供了一种文本录入方法和装置、电子设备及存储介质,属于文本处理技术领域,适用于金融科技和医疗领域。该方法包括:获取结构化文本图像;对结构化文本图像进行字符识别,得到文本框位置信息及文本内容信息,其中,文本框位置信息包括文本框粘连信息;基于文本框位置信息,对文本内容信息进行板式还原,得到目标结构化文本;基于文本框粘连信息,对目标结构化文本进行文本框分割,得到标准文本;对标准文本进行首尾文本打点,得到文本内容合并标记点;基于文本内容合并标记点,对标准文本进行文本合并,得到结构化合并文本;对结构化合并文本进行文本录入。本申请实施例能够提高文本录入的准确率。
技术关键词
文本录入方法
字符识别
标记
文本处理技术
电子设备
打点模块
排版
可读存储介质
录入装置
元素
数据获取模块
位置识别
语义
图像分割
处理器
存储器
计算机
系统为您推荐了相关专利信息
训练图像数据
边缘检测算子
图像块
采样模块
图像分割方法