文档字段提取方法、装置及存储介质

AITNT
正文
推荐专利
文档字段提取方法、装置及存储介质
申请号:CN202510881151
申请日期:2025-06-27
公开号:CN120893432A
公开日期:2025-11-04
类型:发明专利
摘要
本申请实施例提供一种文档字段提取方法、装置及存储介质。方法包括:确定待提取的目标文档的字符串长度;在字符串长度大于识别模型的输入长度阈值的情况下,将目标文档切片成多个子文本;对每个子文本进行迭代精炼操作,并将迭代精炼后的每个子文本合并,以得到优化后的目标文档,其中迭代精炼后的每个子文本的文本字数小于或等于字数阈值,字数阈值是根据输入长度阈值确定的;将优化后的目标文档输入至识别模型,并获取识别模型根据提取任务对优化后的目标文档进行字段提取后输出的内容。
技术关键词
字段提取方法 文本 切片 机器可读存储介质 结点 指令 处理器 存储器 语义 算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号