摘要
本发明公开了一种面向军事领域的小样本实体抽取方法,涉及自然语言处理技术领域,包括以下步骤:在小样本军事文本中,将非关联句子对输入至BERT模型中进行训练,获取向量表示;将向量表示输入至IDCNN模型中,在经典的卷积上增加一个膨胀宽度,利用卷积神经网络对句子进行特征提取;结合CRF模型对提取的特征进行序列标注;根据给定的序列和对应的标签序列,经过线性映射得到每个标签的得分,各标签得分对比获得全局最优标签序列。本发明充分利用了BERT、IDCNN和CRF模型的优势,在保持BERT模型优点的同时,充分捕获文本特征,基于适量的训练参数下训练模型,取得了有效的实体抽取效果,同时训练成本低,缩短使用周期,符合对军事领域的小样本实体抽取使用。
技术关键词
实体抽取方法
CRF模型
BERT模型
标签
军事
序列
样本
维特比算法
上下文特征
正则化参数
代表
文本
自然语言
线性
字词
词语
分词
语义
系统为您推荐了相关专利信息
周边结构
舒适度
土体参数
训练样本集
灰狼优化算法
疲劳状态检测
时序
长短期记忆网络
意图识别模型
数据
解析方法
多源异构数据
监督学习策略
数据标签
项目
无人机
语义标签
动态场景感知
聚类机制
全局地图
标签
语义
内容分析方法
通话内容分析
神经网络架构