摘要
本申请涉及数据库查询技术领域,具体涉及基于大数据分析的日志数据快速查询方法、设备及介质,该方法包括:从日志数据库中导出各元组;获取任一元组中任一列文本数据的相似度序列并进行曲线拟合,得到第一拟合函数;获取所有任意两个元组之间的时间权重并进行曲线拟合,得到第二拟合函数,对第一拟合函数进行修正;获取所述任一列文本数据的文本相似系数;获取各元组的总数据向量,对所有元组聚类,其中,通过各元组与各聚类簇中心之间的时间戳差异量及总数据向量相似性,获取各元组与各聚类簇的聚类中心之间的度量距离;对各聚类簇降维,通过降维结果进行数据查询。本申请能够在缩小查询空间的基础上,提高查询结果的准确性。
技术关键词
数据快速查询方法
文本
日志数据库
数据库查询技术
度量
序列
词向量模型
可读存储介质
聚类
处理器
表达式
计算机设备
元素
直线
存储器
数值
系统为您推荐了相关专利信息
网络安全事件
预训练语言模型
抽取系统
数据
框架
文本生成方法
扩散算法
分块
分层
马尔可夫链模型
虚假信息检测方法
大语言模型
信息检测系统
注意力机制
关键词