摘要
本发明提供了一种面向无人车运行日志的结构化解析与语义模板归一方法。针对无人车日志数据非结构化、格式多变、语义复杂等问题,采用多语言句向量编码模型将日志转换为语义向量,通过增量主成分分析方法降维后使用小批量K均值聚类算法进行语义分组;对聚类结果使用正则表达式提取可变字段并生成标准化模板;通过计算模板间的余弦相似度和编辑距离实现模板智能合并。该方法具有三个技术特点:1)采用先聚类后归一的策略提升模板一致性;2)引入双重相似度约束降低模板冗余;3)保留变量顺序和语义信息支持后续分析。本方法适用于各类复杂系统的日志数据解析与智能运维。
技术关键词
语义向量
K均值聚类算法
面向无人车
主成分分析方法
多语言
语义模板
标准化模板
语义特征提取
编码
编辑距离算法
变量
日志级别
文本
系统为您推荐了相关专利信息
多语言界面
自动化测试方法
爬虫算法
元素
机器可读程序