摘要
本申请实施例提供一种文档字段提取方法、装置及存储介质。方法包括:确定待提取的目标文档的字符串长度;在字符串长度大于识别模型的输入长度阈值的情况下,将目标文档切片成多个子文本;对每个子文本进行迭代精炼操作,并将迭代精炼后的每个子文本合并,以得到优化后的目标文档,其中迭代精炼后的每个子文本的文本字数小于或等于字数阈值,字数阈值是根据输入长度阈值确定的;将优化后的目标文档输入至识别模型,并获取识别模型根据提取任务对优化后的目标文档进行字段提取后输出的内容。
技术关键词
字段提取方法
文本
切片
机器可读存储介质
结点
指令
处理器
存储器
语义
算法