摘要
本申请公开了一种数据抽取方法、系统、电子设备及存储介质。其中,方法包括:获取到多个待检测文档,以及构建目标业务的实体关系集合;其中,实体关系集合包括多个三元组,各三元组包括目标业务相关的两个实体以及两个实体的对应关系;对各待检测文档分别进行特性向量提取,得到各待检测文档的第一特征向量集;利用第一特征向量集得到各待检测文档与实体关系集合的关联关系从多个待检测文档中选出目标业务的目标文档;将目标文档划分成多个关联片段,按照实体关系集合的各三元组对关联片段进行关系映射抽取,得到与各三元组关联的多个片段数据,得到目标业务的片段数据集。可以解决文档关系抽取的效率和准确率低的技术问题。
技术关键词
数据抽取方法
三元组
实体
关系
关键词
数据抽取系统
可执行程序代码
电子设备
可读存储介质
语义
词语
匹配模块
存储器
计算机
分词
指令
处理器
系统为您推荐了相关专利信息
焊接参数控制
功率调节方法
激光焊接机
电阻变化值
曲线
配送优化方法
配送站点
计划
皮尔逊相关系数
指标