基于医疗字典知识增强的中文电子病历命名实体识别方法

正文

推荐专利

申请号：CN202410786765

申请日期：2024-06-18

公开号：CN118643833B

公开日期：2024-12-31

类型：发明专利

摘要

本发明公开了基于医疗字典知识增强的中文电子病历命名实体识别方法，首先收集中文电子病历医疗文本数据，并构造医疗字典，应用预训练语言模型RoBERTa‑wwm‑ext‑large对中文电子病历文本数据进行特征提取；然后将特征向量输入BiLSTM模型，学习医疗文本的上下文语义，同时查询医疗字典，设计掩码注意力机制，计算与字典中医疗概念相匹配的token的局部注意力权重，得到包含电子病历上下文信息的综合语义特征；最后利用全局指针网络模型GP同时考虑实体的头部和尾部的特征信息来预测嵌套实体，有效地解决中文电子病历命名实体识别任务中实体边界模糊和实体嵌套难以处理的问题。

技术关键词

中文电子病历 BiLSTM模型字典综合语义预训练语言模型概念医疗文本数据命名实体识别双曲正切函数注意力机制非线性编码指针

系统为您推荐了相关专利信息

一种基于多模态交叉注意力与动态特征融合的音乐生成方法

音乐生成方法文本注意力多模态长短期记忆网络

一种基于大语言模型的电子病历自动化质控系统与方法

术语多层注意力机制电子病历数据预训练语言模型语义

互联网金融风控引擎跨语言实现方法及系统

互联网金融风控数据库查询语句业务系统标签字典

一种中小企业数字化转型评估方法

指标时间段构建智能合约业务系统关键词

一种基于知识蒸馏技术的中文事件抽取方法

知识蒸馏技术预训练语言模型序列标注模型中文事件抽取方法事件触发词

基于医疗字典知识增强的中文电子病历命名实体识别方法

站点导航

APP 下载