一种能源行业大数据的语料库自动构建方法及系统

AITNT
正文
推荐专利
一种能源行业大数据的语料库自动构建方法及系统
申请号:CN202410826907
申请日期:2024-06-25
公开号:CN118885555A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种能源行业大数据的语料库自动构建方法及系统,包括:采集能源行业数据,分析得到能源实体及事件关系,定义要素路径并构建触发词语义匹配模板;根据关键要素路径比例,计算关键要素路径集合;根据触发词匹配率,匹配事件关系,使用语义单元生成能源事件关系语料库。本发明通过采集和分析能源数据,定义要素路径并构建触发词语义匹配模板,奠定了数据处理基础。计算关键要素路径集合,优化匹配模板,提高匹配精度。随后,通过匹配事件关系,使用语义单元生成高质量语料库,确保丰富的事件关系和实体信息。建立事件关系抽取模型并进行两阶段训练,生成的语料库具备高准确性和全面性,显著提升了大数据分析和应用的效率与可靠性。
技术关键词
事件关系抽取 自动构建方法 语义 计算机可执行指令 大数据 BERT模型 能源 词语 两阶段 模板 实体 处理器 构建系统 定义 文本 匹配模块
系统为您推荐了相关专利信息
1
一种零售客服的响应方法和零售客服系统
大语言模型 文本 客服系统 数据转换单元 编码器
2
基于数字模型的节点深化自动化实现方法及设备
插件 主梁钢筋 计算机可执行指令 节点 三维钢筋模型
3
语义大模型增量预训练方法及相关装置
预训练方法 语义 专业 预训练系统 网络
4
电池BMS管理算法优选特征工程方法及装置
单体电池内阻 管理算法 充放电容量 标签 人工神经网络算法
5
基于大模型实现涉旅企业助手的应用方法
生成图表 依存句法分析 分类器 编排技术 地址映射关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号