一种融合段落和文档特征的金融公告事件抽取方法

AITNT
正文
推荐专利
一种融合段落和文档特征的金融公告事件抽取方法
申请号:CN202410713191
申请日期:2024-06-04
公开号:CN118673919A
公开日期:2024-09-20
类型:发明专利
摘要
本发明公开了一种融合段落和文档特征的金融公告事件抽取方法,涉及金融领域与信息抽取技术领域,具体如下:步骤1.对金融公开数据集ChFinAnn中的金融公告文本进行数据预处理工作,将金融公告划分为段落;步骤2.利用Fin‑BERT预训练模型、卷积神经网络以及自注意力机制对金融公告进行段落特征的提取;步骤3.利用word2vec模型和双向长短期记忆网络对金融公告进行文档特征的提取;步骤4.将经过Fin‑BERT预训练模型得到的段落分类向量送入卷积神经网络,对金融公告中的事件进行分类判断;步骤5.将提取到的段落特征与文档特征融合后,通过双向长短期记忆网络与条件随机场对金融公告中的事件进行事件论元识别抽取。本发明达到了较好的事件抽取性能,具有较高的准确率。
技术关键词
事件抽取方法 文档特征 金融 双向长短期记忆网络 文本 word2vec模型 条件随机场 标签 注意力机制 字符 信息抽取技术 维特比解码 矩阵 编码 定义 序列特征 语义 数据
系统为您推荐了相关专利信息
1
一种基于局部生成双驱动的图像文本跨模态检索模型、方法以及计算机设备
图像全局特征 局部细节特征 融合特征 生成图像特征 图像局部特征
2
图像识别模型的训练方法及装置、电子设备和存储介质
视觉 图像识别模型 答案 数据 掩码矩阵
3
基于大语言模型和多模态数据的多智能体协同态势感知方法
态势感知方法 文本 大语言模型 图片 适配器
4
基于工艺工序与时序相似性知识迁移的工业碳排放数据缺失填补方法及系统
文本特征向量 填补方法 数据 时序 深度学习模型训练
5
一种基于多模态模型的交互式图像标注方法及系统
交互式图像标注 多模态 文本 置信度阈值 索引表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号