基于预训练模型和词义增强的事件抽取系统及方法

AITNT
正文
推荐专利
基于预训练模型和词义增强的事件抽取系统及方法
申请号:CN202411890968
申请日期:2024-12-20
公开号:CN119848229B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于预训练模型和词义增强的事件抽取系统及方法,领域词向量获取模块得到领域词向量;数据集构造模块获取特定领域文本序列数据集;事件抽取模型构造模块构建事件抽取模型;训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置,并利用已标注特定领域文本序列数据集对事件抽取模型进行训练;事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示,并在模型中引入CRF层,提高事件抽取任务中标签标注的准确性,解决了特定领域事件抽取中,标注数据稀缺和专业性强、语境复杂的问题。
技术关键词
事件抽取系统 预训练模型 字符 序列 文本 标签 数据 Word2Vec模型 代表 模块 编码器 解码器 事件抽取方法 词典 词语 度评估方法 注意力 可读存储介质 格式
系统为您推荐了相关专利信息
1
基于互联网平台的文本检索纠错大数据处理系统
大数据处理系统 特征评估模型 纠错模块 互联网 文本分析模型
2
血压预测模型的训练方法和血压数据预测方法
序列 脉搏波传播时间 血压 可穿戴设备 加速度
3
一种磨机部件寿命预测方法、系统、设备及介质
剩余使用寿命 磨机部件 寿命预测方法 故障特征 寿命预测模型
4
基于图知识蒸馏的跨语言新闻核心事件分析方法
事件分析方法 蒸馏 事件特征 节点 低资源语言
5
造纸网毯生产控制系统的故障检测方法及系统
造纸网毯 网络 数据 基础 故障检测方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号