摘要
本申请提供一种农作物病虫害文本实体识别模型训练方法和实体识别方法,该方法包括:获取训练样本集合,训练样本集合包括多个批次的训练样本,每个批次的训练样本包括多个训练文本以及对应的每个词语的实体标签,每个训练文本为农作物病虫害文本;根据训练样本集合对预训练模型进行训练,获得训练完成的文本实体识别模型;文本实体识别模型基于BERT预训练模型的输出特征,构建包含BERT预训练编码层、双向LSTM层、融合卷积神经网络层、多头注意力机制层、全连接层以及条件随机场层的实体识别模型组成的架构,得到的文本实体识别模型可以对输入的文本数据中的命名实体进行精确识别,提高农作物实体识别(如农作物病虫害)的准确性。
技术关键词
文本实体识别
局部特征提取
命名实体识别
农作物病虫害
条件随机场
词语
实体识别方法
多头注意力机制
模型训练方法
标签
序列
分词
实体识别模型
输出特征
预训练模型
数据
同义词
语义