文档信息提取方法、装置、电子设备及介质

AITNT
正文
推荐专利
文档信息提取方法、装置、电子设备及介质
申请号:CN202510287316
申请日期:2025-03-12
公开号:CN119783658A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供了一种文档信息提取方法、装置、电子设备及介质,具体实现方案包括:获取待处理文档,待处理文档为不包含标题标识的文档,标题标识用于标识待处理文档中各个章节标题的标题级别;对待处理文档进行解析处理,以确定待处理文档中的多个章节标题各自对应的文本内容信息和文本位置信息;根据多个章节标题各自对应的文本位置信息,确定各个章节标题对应的标题级别;调用大语言模型基于多个章节标题各自对应的文本内容信息、文本位置信息和标题级别,对待处理文档中多个章节标题之间的章节内容进行信息提取,得到信息提取结果。
技术关键词
大语言模型 信息提取方法 文档信息提取装置 数据处理平台 数据管理系统 标识 处理器 电子设备 数据处理系统 计算机程序产品 数据采集模块 文本行 层级 可读存储介质 指令 存储器
系统为您推荐了相关专利信息
1
一种基于对比学习的大语言数据集构建方法
数据集构建方法 识别模块 语种识别 实体 语义特征
2
一种智能代理微调数据的生成方法、设备及存储介质
大语言模型 历史会话 生成方法 微调方法 数据
3
基于多模态数据的灾害检测方法、装置、设备和存储介质
多模态 融合特征 数据 时序特征 计算机执行指令
4
基于多智能体推理的开放式问题隐含意图识别方法及系统
意图识别方法 多语言 信息检索 文本 节点
5
一种基于大语言模型的重大决策合法合规性审查系统
大语言模型 合规性 文本 决策 文档分割方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号