摘要
本发明提出一种小样本油气管道事故实体识别方法,旨在解决该领域小样本NER任务中数据稀缺及实体标签对不齐问题。具体步骤为:先用基于相似度量的实体替换技术,通过预训练模型算余弦相似度,生成多样训练样本;再提出改进的掩码语言模型(MLM‑E),引入实体标签信息重建被掩码实体,生成优质增强数据,解决实体标签对不齐难题;最后引入知识蒸馏技术,将教师模型知识迁移到学生模型,用软标签指导训练,提升语义学习能力。该方法经数据增强与知识蒸馏,有效提高油气管道事故领域实体识别的准确性和鲁棒性,为油气管道安全管理提供智能化方案,具重要实际应用价值。
技术关键词
实体识别方法
知识蒸馏技术
预训练模型
管道
标签
实体识别模型
样本
语义
学生
教师
标注工具
数据
联合损失函数
文本
识别油气
模型超参数
上下文特征
度量
系统为您推荐了相关专利信息
粒子群算法
网络优化
因子
贡献率
锂离子电池充放电