摘要
本发明公开了一种能源行业大数据的语料库自动构建方法及系统,包括:采集能源行业数据,分析得到能源实体及事件关系,定义要素路径并构建触发词语义匹配模板;根据关键要素路径比例,计算关键要素路径集合;根据触发词匹配率,匹配事件关系,使用语义单元生成能源事件关系语料库。本发明通过采集和分析能源数据,定义要素路径并构建触发词语义匹配模板,奠定了数据处理基础。计算关键要素路径集合,优化匹配模板,提高匹配精度。随后,通过匹配事件关系,使用语义单元生成高质量语料库,确保丰富的事件关系和实体信息。建立事件关系抽取模型并进行两阶段训练,生成的语料库具备高准确性和全面性,显著提升了大数据分析和应用的效率与可靠性。
技术关键词
事件关系抽取
自动构建方法
语义
计算机可执行指令
大数据
BERT模型
能源
词语
两阶段
模板
实体
处理器
构建系统
定义
文本
匹配模块
系统为您推荐了相关专利信息
插件
主梁钢筋
计算机可执行指令
节点
三维钢筋模型
单体电池内阻
管理算法
充放电容量
标签
人工神经网络算法
生成图表
依存句法分析
分类器
编排技术
地址映射关系