摘要
本发明提供一种取水许可管理资料命名实体识别方法及装置,属于自然语言处理技术领域,方法包括:对取水许可管理资料进行文本预处理,并采用BIO注释法对预处理后的文本进行实体标注,形成初始数据集;对初始数据集进行数据增强,以扩充样本构建取水许可领域专业数据集;利用取水许可领域专业数据集,训练取水许可管理命名实体识别模型;将待识别的取水许可管理资料输入至训练完成的取水许可管理命名实体识别模型,确定实体识别结果。本发明针对长江取水许可管理语料库稀缺的问题,提出了基于词典构建和预训练模型的新型数据增强方法;针对长江取水许可管理资料命名实体识别困难的问题,设计了面向长江取水许可管理资料的命名实体识别模型。
技术关键词
命名实体识别方法
命名实体识别模型
许可
资料
双向长短期记忆
条件随机场
文本
同义词
数据
命名实体识别装置
非暂态计算机可读存储介质
管理语料库
专业
训练语言模型
序列
词典
标签
处理器
系统为您推荐了相关专利信息
漏洞知识库
强化学习算法
生成对抗网络
多模型协同
渗透测试方法
归算方法
卫星测高数据
线性回归模型
序列
海洋测绘技术
命名实体识别模型
文本
关系抽取模型
分词
实体抽取方法
解读方法
性激素
构建机器学习模型
数据生成器
女性
双向长短期记忆
电量预测方法
数据
卷积神经网络模型
门控循环单元