摘要
本发明公开了一种基于大模型与知识图谱的铁路标准规范数字化处理方法,包括S1.铁路标准规范预处理,S2.铁路标准规范术语知识图谱构建,S3.铁路标准规范条文的语义拆分组合及语义提取,S4.铁路标准规范的结构化输出。本发明以大模型技术为核心,高度融合大模型的自然语言语义理解能力和知识图谱的行业知识管理能力,通过规范中术语智能提取、术语释义的语义拆解及术语相似度的智能计算,建立了铁路标准规范术语知识图谱,用以替代传统数字化处理中建立词典及近义词表的步骤,基于大模型智能拆分标准规范条文并初步提取关键词集,基于术语知识图谱扩充关键词集,自动构建近义词、关联词集合,最后,利用Python的lxml库对解析结果进行结构化输出,实现了铁路标准规范的高效数字化处理。
技术关键词
术语
实体
铁路
关键词
关系
语义
分词
知识图谱构建
定义
页面
词典
格式
自然语言
列表
英语
核心
数据
系统为您推荐了相关专利信息
交互模型
交互终端
人机交互界面
输入区
交互方法
作业指导书
智能查询方法
节点
表格
知识图谱查询
交易优化方法
电力存储设备
波动特征
多元回归分析
曲线特征