摘要
本发明公开了一种基于伪标签降噪策略的跨语言命名实体识别方法,包括以下步骤:1)给定一段目标语言数据集包含n个字词的文本X,为X中的连续文本片段si分配实体标签,进行文本片段分类;2)对于目标语言数据集的文本X,对其进行掩码处理;3)训练源模型,在源语言数据上进行实体识别任务;4)训练目标模型;在目标语言数据上进行实体识别任务。本发明提出了一种利用语义空间全局和局部语义信息逐步提高伪标签准确性的方法,可以有效提高模型处理目标语言的实体识别的能力。
技术关键词
命名实体识别方法
标签
语义向量空间
预训练语言模型
文本
字词
数据
策略
归一化方法
原型
邻居
处理器
存储装置
周期
可读存储介质
分类器
编码
电子设备
系统为您推荐了相关专利信息
事件分析方法
智能决策模型
生物特征数据
多模态数据融合
报告
样本学习方法
图像增强手段
视觉特征
训练特征
模板
重建系统
视频压缩
sigmoid函数
视觉特征
解码器
动态链接库文件
文件扩展名
计算机数据保护
编辑
编码