摘要
本发明涉及日志文件处理技术领域,尤其是一种日志模板生成方法、日志标记方法和系统。本发明首先对训练集中的日志进行分词,以分词作为叶子节点,建立通过层次结构反应日志内容的模板树,结合相似度合并模板树分支;将根节点到日志最后一个分词的路径作为日志模板并提取关键词列表;对关键词类别进行聚类,针对每一个类,结合类内所有关键词构成类内日志的通用模板。本发明旨在自动抽取并标记亿级日志模板,同时提高其通用性,解决现代软件系统中海量日志数据处理难题。
技术关键词
日志模板生成方法
标记方法
节点
关键词
TextRank算法
列表
统计分词
聚类
海量日志
标记系统
存储器
处理器
支路
分支
序列
关系
系统为您推荐了相关专利信息
无缝钢管热轧
区间预测方法
热轧无缝钢管
随机森林
环形加热炉
深度学习模型
大语言模型
商品推荐方法
账户推荐
关键词
电网设备
调度控制方法
调度控制系统
服务端
变压设备
遥感图像分割方法
跨模态
图像编码器
语言编码器
图像解码器
电化学储能系统
电化学储能电站
接入配电网
数学模型
指标