基于伪标签降噪策略的跨语言命名实体识别方法

AITNT
正文
推荐专利
基于伪标签降噪策略的跨语言命名实体识别方法
申请号:CN202410925345
申请日期:2024-07-11
公开号:CN118798199A
公开日期:2024-10-18
类型:发明专利
摘要
本发明公开了一种基于伪标签降噪策略的跨语言命名实体识别方法,包括以下步骤:1)给定一段目标语言数据集包含n个字词的文本X,为X中的连续文本片段si分配实体标签,进行文本片段分类;2)对于目标语言数据集的文本X,对其进行掩码处理;3)训练源模型,在源语言数据上进行实体识别任务;4)训练目标模型;在目标语言数据上进行实体识别任务。本发明提出了一种利用语义空间全局和局部语义信息逐步提高伪标签准确性的方法,可以有效提高模型处理目标语言的实体识别的能力。
技术关键词
命名实体识别方法 标签 语义向量空间 预训练语言模型 文本 字词 数据 策略 归一化方法 原型 邻居 处理器 存储装置 周期 可读存储介质 分类器 编码 电子设备
系统为您推荐了相关专利信息
1
基于多模态数据的事件分析方法、装置、设备及介质
事件分析方法 智能决策模型 生物特征数据 多模态数据融合 报告
2
一种任务适应关联学习的小样本学习方法
样本学习方法 图像增强手段 视觉特征 训练特征 模板
3
深度学习驱动的视频压缩与高保真重建系统
重建系统 视频压缩 sigmoid函数 视觉特征 解码器
4
文档相似性分析方法、装置、设备、存储介质及产品
相似性分析方法 对象 文本 图像 哈希算法
5
一种加密运行NX后处理程序的方法
动态链接库文件 文件扩展名 计算机数据保护 编辑 编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号