摘要
本发明公开了一种基于MMoE多任务的中文医学命名实体识别的方法,具体来说文本输入BERT模型得到序列特征以及整体语义特征;后续根据实体类别数确定任务个数并设置多个专家;最后将特征输入MMoE‑NER模块,得到各任务概率输出矩阵。本发明的模型优点在于提出了一种不依赖于单一模型的多个专家模型,从而显著减轻单一模型监督带来的问题,并利用ResNet‑CNN卷积神经网络来解决实体边界信息模糊的问题,后续对实体采取负采样的训练学习方式来缓解数据集漏标所带来的问题,最终提高模型对实体的识别效果。
技术关键词
医学命名实体识别
序列特征
输出特征
多任务
BERT模型
语义特征
语义标签
GRU模型
ResNet网络
样本
文本
矩阵
模型训练方法
权重特征
预训练模型
数据
残差结构
系统为您推荐了相关专利信息
声纹特征
语义特征
交互式语音应答
资源
训练样本数据
文档自动生成方法
大语言模型
GCN模型
文本
标准化模板
状态在线识别方法
接触器
智能优化算法
图像
镜像对称