摘要
本发明公开了文本实体识别与数据结构化处理方法及系统,属于数据处理技术领域,其具体包括:获取待处理医疗诊断文本数据,并生成查询脚本;通过该脚本抽取样例数据,将其输入双阶段实体识别模型进行实体识别与指标项提取,得到初步指标项集合,并判断是否满足预设结构化需求,若满足则将数据转化为结构化实体;根据该结构化实体确定数据类别,轮询后台病例库生成结构化指标结果集;从结构化指标结果集中抽取样本进行医学人员校验,根据校验结果修正结构化实体的指标项,确保了结构化实体的准确性和完整性。
技术关键词
文本实体识别
实体识别模型
指标
语句
医疗实体识别
词语
实体关系数据
图谱
脚本
关键词
字符串匹配算法
数据获取模块
随机抽样方法
三元组
校验模块
频率
系统为您推荐了相关专利信息
三维形貌特征
三维扫描仪
三维模型
强度
法对试样
指标
生成容器
资源隔离方法
网络隔离方法
筛选方法