摘要
本发明提出一种小样本油气管道事故实体识别方法,旨在解决该领域小样本NER任务中数据稀缺及实体标签对不齐问题。具体步骤为:先用基于相似度量的实体替换技术,通过预训练模型算余弦相似度,生成多样训练样本;再提出改进的掩码语言模型(MLM‑E),引入实体标签信息重建被掩码实体,生成优质增强数据,解决实体标签对不齐难题;最后引入知识蒸馏技术,将教师模型知识迁移到学生模型,用软标签指导训练,提升语义学习能力。该方法经数据增强与知识蒸馏,有效提高油气管道事故领域实体识别的准确性和鲁棒性,为油气管道安全管理提供智能化方案,具重要实际应用价值。
技术关键词
实体识别方法
知识蒸馏技术
预训练模型
管道
标签
实体识别模型
样本
语义
学生
教师
标注工具
数据
联合损失函数
文本
识别油气
模型超参数
上下文特征
度量
系统为您推荐了相关专利信息
起重吊装作业
视觉检测模块
中央控制模块
UWB定位标签
定位数据处理
变刚度软体机器人
充气气囊
驱动模组
气体输送管
波纹管结构
故障分类模型
故障分类方法
特征提取网络
深度图
线性分类器
标注系统
数据模块
数据管理单元
分割算法
医疗影像数据