摘要
本发明公开了一种跨领域的少样本命名实体抽取方法,属于自然语言处理技术领域。针对现有实体抽取方法缺乏对实体表示的专门优化、实体类型标签的语义信息利用不充分的问题,一方面,通过多粒度对比学习显式强化实体跨度表示中对命名实体抽取更有益的语义信息,增强其实体跨度检测性能;另一方面,通过双重感知对比学习有效的利用实体类型标签中蕴含的语义信息,构建更加稳定的实体类型原型表示,增强其实体分类性能。此外,基于原型网络的设计使其具备了充分的跨领域能力,能够较为容易的进行领域迁移,而无需依赖大量的标注数据,进而提升跨领域场景下的少样本命名实体抽取模型的准确率,同时降低了数据标注带来的人力成本。
技术关键词
命名实体抽取方法
标签
原型
训练语言模型
字符
样本
序列
跨度
语义
文本
编码器
更新模型参数
自然语言
偏差
阶段
定义
系统为您推荐了相关专利信息
医学图像分割方法
无标签数据
注意力机制
预测类别
图像块
网络时间协议
故障分析方法
统一信息模型
知识图谱构建
数据
物件识别装置
图像传感器
云台机构
识别方法
识别模块
相似性判断方法
分类号
注意力机制
树型结构
损失计算方法