摘要
本发明属于自然语言处理技术领域,具体涉及基于循环BERT和角标记的航空事故文本数据抽取方法,其包括:S1、使用双循环BERT模型识别航空事故报告文本数据的触发词;S2、使用分类器模型联合计算航空事故报告的文本数据论元向量;S3、根据文本数据触发词的向量和论元标签计算文本数据论元向量的总置信度;S4、使用角标记矩阵解码航空事故报告文本数据的事件三元组,得到文本数据的总损失值;S5、根据总损失值判断抽取航空事故报告文本数据。本发明通过双循环训练模型识别语境信息和论元位置,进而联合计算论元置信度降低冗余错误和级联误差,增加三元组预测正确率,使用角标记方法降低模型复杂度,增加抽取结果全面性。
技术关键词
分类器模型
文本
数据抽取方法
航空
三元组
BERT模型
双循环
解码
报告
矩阵
误差
标签
梯度下降优化算法
传播算法
参数
更新分类器
特征值
标记方法
系统为您推荐了相关专利信息
SQL语法
语句
关系型数据
设计系统
电数字数据处理技术
数据检索系统
网关
检索方法
存储库
循环神经网络模型