摘要
本申请公开了一种文本提取方法、装置、电子设备及非易失性存储介质。其中,该方法包括:在流文本的第一待处理字符串中检索目标标识符,其中,所述目标标识符为用于表示所述第一待处理字符串的格式类型的字符;在检索到目标标识符后,以目标标识符为起始位置,依据格式类型在第一待处理字符串中检索标签,其中,标签用于标识属于格式类型的字符串的起点或终点;依据标识符从第一待处理字符串中提取出目标字符串,并将目标字符串存入格式类型对应的存储空间中,其中,目标字符串为标签之间的字符串。本申请解决了由于相关技术中无法准确区分各类文本的具体类型导致的分割提取的准确率较低的技术问题。
技术关键词
文本提取方法
标识符
检索标签
非易失性存储介质
格式
终点
文本提取装置
字符
电子设备
语句
计算机程序产品
标记
处理器
语义
存储器
模块
系统为您推荐了相关专利信息
订单
客户
RPA机器人
集成模块
机器学习分类模型
图像特征信息
图像块
数字化X线摄影
编码
质检方法
岩石薄片
可视化方法
皮尔逊相关系数
激光扫描共聚焦显微镜
原油