摘要
本发明公开了一种基于NLP的数据管理系统及方法,涉及自然语言处理与数据管理技术领域,该方法包括以下步骤:通过数据接口获取非结构化电子病历数据,并进行数据预处理;通过提取疾病关键词并根据就诊时间分析数据,构建规则库进行关键词匹配,利用决策树模型优化分类结果,并评估分类质量;通过NLP技术从非结构化病历数据中提取相关实体和实体之间的关系,构建知识图谱,通过分析图谱节点和边的结构计算实体间的相似度与因果关系,结合图神经网络对知识图谱进行优化建模;对电子病历进行排序并提取时间特征,评估诊断信息的时效性并进行标注,同时对知识图谱中的病历数据进行可信度评估,本发明实现对非结构化电子病历数据管理。
技术关键词
结构化电子病历
关键词
数据管理系统
编辑距离算法
结构化病历数据
实体
数据管理方法
NLP技术
节点
决策树模型
医学术语库
词向量模型
构建规则库
构建知识图谱
疾病
系统为您推荐了相关专利信息
生成表格
训练机器学习模型
参数
解析算法
机器学习模型训练
车牌识别模型
实时视频流
导流
字符识别模型
识别方法