摘要
本发明提供了一种基于跨度表示的自适应学习命名实体识别方法、系统、设备以及存储介质,包括以下步骤:获取目标的历史数据,其中对所述历史数据预处理,生成训练样本集,所述训练样本集通过数据增强方式扩充训练样本集多样性;根据所述训练样本集通过悬浮标记方法进行标记实体,该方法能够在有效识别文本嵌套实体,并缓解标签不均匀分布,使用数据增强扩充训练样本集多样性,并使用自适应学习算法实现稳健的数据增强。该方法首先进行数据增强,然后使用悬浮标记强调文本,并分组悬浮标记,训练采用不均衡损失函数,训练时使用自适应学习在线计算增强数据权重,实验结果表明该方法有效提升了模型效果。
技术关键词
命名实体识别方法
训练样本集
扩充训练样本
历史数据预处理
标记方法
生成训练样本
跨度
学习算法
命名实体识别系统
字符
模型训练模块
标签
可读存储介质
数据获取模块
处理器
注意力机制
文本
系统为您推荐了相关专利信息
直驱式风力发电机
电网故障辨识方法
数据驱动型
Simulink模型
逆变器
面部图像数据
面部特征检测
特征数据库
高斯混合模型
生理
车灯
深度神经网络
热力图
灯光控制方法
训练样本集
特征提取模块
识别方法
训练样本集
识别系统
前馈神经网络