摘要
本发明公开了一种半监督信息提取方法、系统、设备及介质,包括:获取待提取文档及本体类;将所述待提取文档进行分割,以形成若干句子;计算每个句子中各实体与本体类的语义相似度,将语义相似度最高的实体作为该句子的实体候选;将各句子的实体候选输入到训练后的关系提取模型中,得到待提取文档中的实体关系以及属性,其中,所述训练后的关系提取模型基于远程监督策略得到的数据集训练而成,该方法、系统、设备及介质能够工程管理文档中实体关系的提取,且具有成本低、准确性强以及表征能力较强的特点。
技术关键词
信息提取方法
建筑工程管理
实体
构建训练集
语义
样本
信息提取系统
关系抽取模型
关系分类器
数据
可读存储介质
策略
处理器
计算机设备
模块
存储器
系统为您推荐了相关专利信息
高效多尺度
注意力机制
多尺度特征
可见光相机
特征选择
智能数据传输方法
解码器框架
高维特征向量
图像重建
双编码器
作业监测方法
视频分析
融合视觉特征
模态特征
局部视觉特征
地理信息处理服务
水文
地理信息数据服务
自动生成方法
服务注册中心