摘要
本发明为一种基于大模型的电力检修数据的结构化提取方法及系统,包括:采集原始电力检修数据并处理;加载电力系统设备的标准化命名映射表并解析;配置并调用大语言模型,对预处理后的待分析文本进行特征提取,得到目标字段的结构化信息;采用基于向量嵌入的语义相似度计算,获取对应的初步匹配结果;根据标准化算法对初步匹配结果进一步计算,建立当前厂站及站内各层级设备的标准化映射索引表;将标准化映射索引表进行整合,封装成系统服务或离线文件的形式输出。本发明实现了对电力检修数据的高效、准确的结构化提取和标准化处理,能够处理复杂的非结构化文本输入,通过语义理解和多级匹配机制,将提取的信息与标准化的设备和厂站名称进行精确对应。这一过程大大提高了数据处理的自动化程度和准确性。
技术关键词
电力系统设备
大语言模型
索引表
电网业务系统
非结构化文本
语义
特征提取模块
远程服务器
层级
输入电力系统
数据上传功能
格式化
序列化方法
文件传输协议
输出模块
编辑
键值
系统为您推荐了相关专利信息
文本特征向量
标签
大语言模型
网络流量检测方法
语义向量
训练样本数据
大语言模型
数据处理方法
指令
数据处理装置
数据库查询方法
大语言模型
文本
知识图谱构建
数据库查询装置