摘要
本发明涉及一种基于特征融合和多任务学习的基因组变异命名实体识别方法及系统,包括:获取带有基因组变异实体标注的生物医学文本数据;对生物医学文本数据进行数据增强生成多样化的增强生物医学文本数据;基于增强生物医学文本数据对命名实体识别模型进行训练,通过训练好的命名实体识别模型对待识别生物医学文本进行命名实体识别,得到识别结果;所述命名实体识别模型包括:注意力增强的多尺度特征融合模块、第一BILSTM层、NER模块、token分类模块和实体边界划分模块;本发明解决了数据稀缺问题,同时提出注意力增强的多尺度特征融合模块解决由于实体长度过长、字符特征复杂导致特征表示不准确的问题,提高识别的准确率。
技术关键词
命名实体识别方法
命名实体识别模型
文本
多任务
命名实体识别装置
字符
注意力
命名实体识别系统
序列
同义词
数据获取模块
存储计算机程序
标签类别
存储器
生成随机
系统为您推荐了相关专利信息
风险评估模型
风险评估方法
风险评估值
数据
矩阵
多智能体协作
融合多模态特征
综合性
前馈神经网络
文本
数据映射方法
多模态
融合特征
传感器
文本特征向量