一种融合段落和文档特征的金融公告事件抽取方法

正文

推荐专利

申请号：CN202410713191

申请日期：2024-06-04

公开号：CN118673919A

公开日期：2024-09-20

类型：发明专利

摘要

本发明公开了一种融合段落和文档特征的金融公告事件抽取方法，涉及金融领域与信息抽取技术领域，具体如下：步骤1.对金融公开数据集ChFinAnn中的金融公告文本进行数据预处理工作，将金融公告划分为段落；步骤2.利用Fin‑BERT预训练模型、卷积神经网络以及自注意力机制对金融公告进行段落特征的提取；步骤3.利用word2vec模型和双向长短期记忆网络对金融公告进行文档特征的提取；步骤4.将经过Fin‑BERT预训练模型得到的段落分类向量送入卷积神经网络，对金融公告中的事件进行分类判断；步骤5.将提取到的段落特征与文档特征融合后，通过双向长短期记忆网络与条件随机场对金融公告中的事件进行事件论元识别抽取。本发明达到了较好的事件抽取性能，具有较高的准确率。

技术关键词

事件抽取方法文档特征金融双向长短期记忆网络文本 word2vec模型条件随机场标签注意力机制字符信息抽取技术维特比解码矩阵编码定义序列特征语义数据

系统为您推荐了相关专利信息

一种基于局部生成双驱动的图像文本跨模态检索模型、方法以及计算机设备

图像全局特征局部细节特征融合特征生成图像特征图像局部特征

图像识别模型的训练方法及装置、电子设备和存储介质

视觉图像识别模型答案数据掩码矩阵

基于大语言模型和多模态数据的多智能体协同态势感知方法

态势感知方法文本大语言模型图片适配器

基于工艺工序与时序相似性知识迁移的工业碳排放数据缺失填补方法及系统

文本特征向量填补方法数据时序深度学习模型训练

一种基于多模态模型的交互式图像标注方法及系统

交互式图像标注多模态文本置信度阈值索引表

一种融合段落和文档特征的金融公告事件抽取方法

站点导航

APP 下载