摘要
本发明涉及一种相似日志模板提取方法及装置,属于相似日志模板提取领域,该方法包括:获取待提取相似日志模板的日志;计算得到日志公共字符串的熵,根据熵和日志的可观测特征对日志进行分类与剔除后进行排序;将排序后的日志输入滑动窗口循环调整匹配阈值;计算字符串间的公共前缀长度更新词汇库,对排序后的日志与词汇库进行距离判断,提取排序后的日志中符合匹配阈值的内容;将提取内容与排序后的日志的日志做序列量化分析判断提取内容是否满足相似度设定,若判断结果为提取内容满足相似度设定,记录日志索引信息,聚合日志模板。本发明优化了相似日志模板相似度判断流程,重点判断信息密集区域,提高了相似日志模板提取的效率与准确性。
技术关键词
日志模板提取方法
滑动窗口
可读存储介质
内容更新
索引
模块
计算机
算法
序列
字符
程序
指令
存储器
处理器
电子设备
频率
数据