摘要
本发明提供一种基于深度主动学习策略的中文古籍实体抽取方法,涉及自然语言处理领域。本发明中,将主动学习策略与基于深度神经网络的实体抽取模型进行模型整合,既能够充分发挥深度网络学习器的模型拟合能力,而且充分利用改进的主动学习策略进一步缓解标注数据不足以及专家标注成本较高的问题。同时,采用融合不确定性、最小边界性和多空间特征表征性的查询策略进行数据池选择,有效提升了学习效率。进一步的,对于实体抽取网络模型,设计一个双编码器结构,将基于预训练学习的全局编码器与基于字符级嵌入的局部编码器进行整合,获取句子的融合语义表示,以全面捕捉句子更加全面的上下文语义知识,从而提升基于深度神经网络实体抽取模型的性能。
技术关键词
实体抽取方法
主动学习策略
查询策略
混合损失函数
标记
深度神经网络
文本
样本
数据
编码器
CRF模型
多空间
字符
变量
深度网络学习
语义
汉字
通道
系统为您推荐了相关专利信息
数据识别方法
三维表面模型
短时傅里叶变换
三维模型
掩膜
输电杆塔接地装置
度评价方法
随机森林模型
输电线路杆塔接地装置
土壤电阻率
零件去毛刺
零件检测装置
参数
检测组件
高精度工业