摘要
本申请涉及文本数据分析技术领域,具体涉及一种电子病历自由文本分析方法、系统及设备,提高了信息提取的效率,减少了人工干预的需求;所述方法包括:接收电子病历自由文本数据,进行清洗、分词和医学术语标准化处理,将非结构化文本转化为结构化数据;基于深度学习和医学知识库,通过预训练语言模型提取文本特征,并在输出层结合条件随机场捕捉实体边界,识别文本中的医疗实体并对识别出的实体进行分类标注;通过依存句法分析和语义角色标注技术,提取实体之间的因果关系、治疗关系和检查关系,构建实体关联网络;结合病历上下文信息对实体分类和关系进行动态修正与补充;将分析结果以结构化JSON格式输出,生成可计算的语义图谱。
技术关键词
文本分析方法
电子病历
医学知识库
语义角色标注
预训练语言模型
依存句法分析
术语标准化
条件随机场
语义图谱
医学知识图谱
实体关系抽取
计算机程序指令
机器学习分类器
分词
知识图谱推理
系统为您推荐了相关专利信息
预训练语言模型
预训练模型
标签预测值
文本
关键词抽取方法
智能管理系统
智能分析模块
实验室信息系统
医院信息系统
机器学习算法
医疗数据处理系统
卫星通讯模块
特征提取网络
跨模态
编码向量
文件排序方法
序列
计算机软件技术
预训练语言模型
长短期记忆网络