摘要
本发明公开了一种融合BERT和BiLSTM的常见病命名实体识别方法,属于自然语言处理与医疗信息处理技术领域。该方法首先通过BERT预训练模型获取输入文本的动态词向量表示,利用其双向Transformer结构捕捉文本的深层语义特征;然后将BERT输出向量输入BiLSTM网络进行上下文特征增强,通过双向长短期记忆网络提取序列的前后向长距离依赖关系;最后引入CRF层对BiLSTM输出的特征进行标签序列约束,利用转移概率矩阵优化实体边界识别。针对中文医疗文本特点,采用字词结合的方式处理未登录词问题,并构建包含症状、疾病、药品等实体的标注语料库进行模型训练,本方法显著提高了医疗实体边界的识别准确率。
技术关键词
命名实体识别方法
常见病
上下文特征
BERT模型
医疗信息处理技术
标签
双向长短期记忆网络
文本
感知损失函数
序列
医学知识库
转移概率矩阵
双通道结构
维特比算法
动态
搜索全局
维基百科
预训练模型
系统为您推荐了相关专利信息
搜索词
无监督学习
联想方法
监督学习方法
BERT模型
推荐系统
可读存储介质
动作自动化
报文
BERT模型
预训练语言模型
关键词
主题特征
上下文特征
序列