摘要
本发明属于自然语言处理技术领域,具体涉及一种大数据中基于仿射特征融合的小样本嵌套命名实体识别方法;包括:嵌套命名实体识别模型包括放射特征融合模块和候选跨度分类模块;采用预训练的BERT模型和BiLSTM网络依次对文本进行两次编码,采用放射特征融合模块对编码结果进行处理,得到候选跨度和分词的全局语义融合特征;根据候选跨度和真实标签计算二元交叉熵损失并调整放射特征融合模块参数,得到训练好的放射特征融合模块;采用候选跨度分类模块对候选跨度和分词的全局语义融合特征进行处理,得到嵌套命名实体识别结果并计算最终损失,根据最终损失调整候选跨度分类模块,得到训练好的候选跨度分类模块;本发明在大数据处理领域自然语言处理中的嵌套命名实体识别任务上性能更好。
技术关键词
跨度
融合特征
命名实体识别模型
大数据
自然语言
样本
标签类别
语义
分词
原型
嵌套
模块
预训练语言模型
矩阵
词嵌入向量
关系
文本
系统为您推荐了相关专利信息
智能测试方法
综合评估模型
规划算法
生成测试报告
智能测试系统
校验方法
校验规则库
自然语言
人工智能算法模型
电力工程评审
决策辅助系统
决策辅助方法
子模块
数据融合算法
人工智能算法