摘要
本发明提供一种用于非结构化检测文本的信息抽取方法装置,方法包括:获取待抽取的非结构化检测文本并进行预处理,获得检测文本序列;将检测文本序列输入至BERT模型进行深层语义编码,输出语义特征向量;将语义特征向量输入至SVM模型进行分类识别,从非结构化检测文本提取关键检测文本片段;将关键检测文本片段输入至LSTM‑CRF模型进行属性识别,输出检测文本属性信息;提取行业标准中相关的标准检测信息建立逻辑映射关系规则集,确定检测文本属性信息中各个信息元素之间的关联关系,形成信息关联规则集;根据信息关联规则集,构建检测事件信息链,该方法能够提高非结构化检测文本信息抽取的准确性。
技术关键词
文本
规则集
信息抽取方法
节点
词语
CRF模型
关系
PageRank算法
关键词
逻辑
语义
位置提取
序列
BERT模型
元素
抽取装置
编码器
编码模块
系统为您推荐了相关专利信息
资源分配方法
能源
机械臂装置
充电调度系统
激光传感器
自动检测方法
双向长短期记忆网络
深度学习语言模型
大语言模型
文本
表格
信息识别方法
非易失性存储介质
识别算法
信息识别装置