摘要
本发明公开了基于预训练模型和词义增强的事件抽取系统及方法,领域词向量获取模块得到领域词向量;数据集构造模块获取特定领域文本序列数据集;事件抽取模型构造模块构建事件抽取模型;训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置,并利用已标注特定领域文本序列数据集对事件抽取模型进行训练;事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示,并在模型中引入CRF层,提高事件抽取任务中标签标注的准确性,解决了特定领域事件抽取中,标注数据稀缺和专业性强、语境复杂的问题。
技术关键词
事件抽取系统
预训练模型
字符
序列
文本
标签
数据
Word2Vec模型
代表
模块
编码器
解码器
事件抽取方法
词典
词语
度评估方法
注意力
可读存储介质
格式
系统为您推荐了相关专利信息
大数据处理系统
特征评估模型
纠错模块
互联网
文本分析模型
剩余使用寿命
磨机部件
寿命预测方法
故障特征
寿命预测模型