摘要
本发明涉及案例数据结构化技术领域,公开了一种换流变故障案例的结构化处理方法、系统、设备和介质,包括对换流变故障案例的原始文本数据进行数据清洗和格式统一,得到文本数据;对文本数据进行预处理,并输入特征提取模型,得到文本特征向量,特征提取模型基于自然语言处理模型构建得到;通过聚类分析算法对所述文本特征向量进行分类,并根据分类结果和固定标签格式,生成换流变故障案例对应的结构化文本。本发明通过自然语言处理技术对换流变故障案例进行特征提取,提高了特征提取的完整率;通过基于聚类分析的标签分配方法,提高了标签分配的准确率,实现了高质量的结构化文本转换,为换流变故障案例智能分析提供了精准高效的数据支持。
技术关键词
文本特征向量
特征提取模型
聚类分析算法
格式
自然语言
数据结构化技术
标签分配方法
K均值聚类算法
空间聚类算法
密度聚类算法
字段
故障案例库
分词
特征提取模块
节点
编码算法
数据处理模块
系统为您推荐了相关专利信息
库存优化管理系统
物资信息管理
分析单元
电力
出入库管理
形近字字典
三元组
多任务协同训练
文本
多任务联合训练
可视化管理方法
可视化管理系统
可视化模块
零件
三维模型可视化
账户异常登录
安全监控方法
金融
长短期记忆神经网络
多层感知机