摘要
本发明公开了一种病历文本中自然语言的提取及转化方法,属于自然语言提取领域,包括以下步骤:文本预处理,对原始病历文本进行清洗和标准化,包括去除标点符号、数字、停用词,转换为小写的操作;文本分割,将病历文本分割成句子或段落;实体识别,识别和提取出病历文本中的实体,实体包括疾病、药物、症状、检查、检验与手术;关系抽取,从病历文本中提取出实体之间的关系特征;异常识别,基于所提取的实体之间的关系特征来分析是否存在异常。本发明,能够将所提取信息之间的关系特征提取出来并进行深度分析,进而及时精准的发现病历文本是否存在异常,从而为医生的临床决策、疾病的监测与预测以及医学研究提供有力的支持。
技术关键词
自然语言
病历
转化方法
文本
关系
序列
医学知识图谱
实体
语义向量
声光报警器
专业名词
疾病
NLP技术
特征词库
字符
雷达
分词算法
药物
标记
变量
系统为您推荐了相关专利信息
知识库构建方法
交互式学习平台
动态更新
知识图谱构建
诊疗环境
节点检测方法
网络拓扑结构
节点检测系统
网络图结构
集成学习方法