摘要
本发明公开了一种融合段落和文档特征的金融公告事件抽取方法,涉及金融领域与信息抽取技术领域,具体如下:步骤1.对金融公开数据集ChFinAnn中的金融公告文本进行数据预处理工作,将金融公告划分为段落;步骤2.利用Fin‑BERT预训练模型、卷积神经网络以及自注意力机制对金融公告进行段落特征的提取;步骤3.利用word2vec模型和双向长短期记忆网络对金融公告进行文档特征的提取;步骤4.将经过Fin‑BERT预训练模型得到的段落分类向量送入卷积神经网络,对金融公告中的事件进行分类判断;步骤5.将提取到的段落特征与文档特征融合后,通过双向长短期记忆网络与条件随机场对金融公告中的事件进行事件论元识别抽取。本发明达到了较好的事件抽取性能,具有较高的准确率。
技术关键词
事件抽取方法
文档特征
金融
双向长短期记忆网络
文本
word2vec模型
条件随机场
标签
注意力机制
字符
信息抽取技术
维特比解码
矩阵
编码
定义
序列特征
语义
数据
系统为您推荐了相关专利信息
图像全局特征
局部细节特征
融合特征
生成图像特征
图像局部特征
文本特征向量
填补方法
数据
时序
深度学习模型训练