摘要
本发明公开了一种基于机器学习的日志字段提取方法、装置、设备及介质。该方法包括:获取目标日志生成源对应的基础历史日志数据集;标准化处理基础历史日志数据集,得到目标历史日志数据集,并基于预设特征分类模型分析处理目标历史日志数据集,得到目标日志生成源对应的共通模式集合;基于预设正则表达式解析处理共通模式集合,生成目标日志生成源对应的正则表达式集合;基于正则表达式集合对目标日志生成源对应的当前日志数据进行字段匹配,得到当前日志数据对应的目标字段。通过本发明的技术方案,能够实现对不同日志生成源进行日志字段提取,提高了日志字段的准确率及提取效率。
技术关键词
日志
字段提取方法
模式
特征提取模型
基础
可读存储介质
关键字
数据获取模块
计算机
聚类
特征值
电子设备
处理器通信
存储器
指令
系统为您推荐了相关专利信息
可编程电路
脉冲发生器模块
编译码器
存储单元
OTP电路
计算机网络安全
GBDT模型
异常数据
系统日志
网络探针