基于自然语言处理的电子病历特征提取方法

正文

推荐专利

基于自然语言处理的电子病历特征提取方法

申请号：CN202411520697

申请日期：2024-10-29

公开号：CN119361058A

公开日期：2025-01-24

类型：发明专利

摘要

本发明公开了一种基于自然语言处理的电子病历特征提取方法，包括：通过对原始电子病历文本进行清洗、医学术语规范化、中文分词和词性标注，生成预处理后的文本数据；利用微调医学语料的预训练BERT模型进行医疗实体识别，提取医疗实体集合；基于自注意力机制构建关系抽取模型，生成实体关系三元组集合；最终将提取的医疗实体和关系存储到图数据库中，提供API接口供查询和分析，从而有效解决了现有技术中对电子病历非结构化文本信息提取困难的问题。

技术关键词

BERT模型自然语言关系抽取模型电子病历医疗实体识别三元组中文分词注意力机制医学术语库非结构化文本序列条件随机场标签生成关系

系统为您推荐了相关专利信息

一种基于AI大模型的智能合同审查及生成系统

生成系统法律文本处理知识图谱构建实体间关系数据库技术

一种基于知识图谱增强思维链提示的大语言模型联合推理方法

实体推理方法答案文本大语言模型

基于DeepSeek大模型与多智能体协同的移动通信网络多维竞对洞察方法

移动通信网络专用智能模态特征多模态融合策略

一种实体识别抽取方法、装置、设备及存储介质

文本实体语义特征矩阵融合注意力机制

一种基于知识图谱的命名实体自动识别方法

自动识别方法命名实体识别模型文本信息传输构建知识图谱生成倒排索引

基于自然语言处理的电子病历特征提取方法

站点导航

APP 下载