基于预训练模型和词义增强的事件抽取系统及方法

正文

推荐专利

申请号：CN202411890968

申请日期：2024-12-20

公开号：CN119848229B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于预训练模型和词义增强的事件抽取系统及方法，领域词向量获取模块得到领域词向量；数据集构造模块获取特定领域文本序列数据集；事件抽取模型构造模块构建事件抽取模型；训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置，并利用已标注特定领域文本序列数据集对事件抽取模型进行训练；事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示，并在模型中引入CRF层，提高事件抽取任务中标签标注的准确性，解决了特定领域事件抽取中，标注数据稀缺和专业性强、语境复杂的问题。

技术关键词

事件抽取系统预训练模型字符序列文本标签数据 Word2Vec模型代表模块编码器解码器事件抽取方法词典词语度评估方法注意力可读存储介质格式

系统为您推荐了相关专利信息

基于互联网平台的文本检索纠错大数据处理系统

大数据处理系统特征评估模型纠错模块互联网文本分析模型

血压预测模型的训练方法和血压数据预测方法

序列脉搏波传播时间血压可穿戴设备加速度

一种磨机部件寿命预测方法、系统、设备及介质

剩余使用寿命磨机部件寿命预测方法故障特征寿命预测模型

基于图知识蒸馏的跨语言新闻核心事件分析方法

事件分析方法蒸馏事件特征节点低资源语言

造纸网毯生产控制系统的故障检测方法及系统

造纸网毯网络数据基础故障检测方法

基于预训练模型和词义增强的事件抽取系统及方法

站点导航

APP 下载