基于查询和元数据异常检测的数据湖仓聚簇方法与系统

AITNT
正文
推荐专利
基于查询和元数据异常检测的数据湖仓聚簇方法与系统
申请号:CN202410944068
申请日期:2024-07-15
公开号:CN118939736A
公开日期:2024-11-12
类型:发明专利
摘要
本发明涉及基于查询和元数据异常检测的数据湖仓聚簇方法与系统,属于大数据计算技术领域。包括:数据采集与预处理;EC‑GKDE算法异常判定:对预处理操作后的数据集进行训练,得到所有查询任务的异常分数,进行初次判定;元数据信息异常判定:获取异常查询任务的关联表,获取Hive元数据服务中HDFS实际路径信息,并计算该HDFS实际路径下小文件所占比例,二次判定该异常查询任务的关联表是否为异常表;聚簇优化:提交聚簇任务,将小文件合并为大文件。本发明减少存储资源的开销,大大降低了查询任务需要消耗的时间;本发明可以控制聚簇操作执行的次数,减轻聚簇机制带来的并发更新不支持、增量查询不友好和集群资源浪费的问题。
技术关键词
核密度估计方法 累积分布函数 高斯核函数 大数据计算技术 样本 算法 语句 异常点 特征值 模块 集群 参数 变量 机制 场景 资源 模式
系统为您推荐了相关专利信息
1
基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备
音频特征提取 模态特征 异常声音 多模态 识别方法
2
一种大蒜品种和产地的预测模型及其训练方法和相关应用
硫醚类化合物 标志物 机器学习模型 溯源方法 大蒜产品
3
一种电梯中人工智能语音模型的建模方法及装置
人工智能语音 语句 建模方法 机器学习模型 标签
4
一种针对无人机影像的建筑物语义变化检测方法
语义变化检测方法 建筑物变化检测 语义特征提取 多任务 无人机
5
一种山岭隧道钻爆法施工补炮事件的预测方法
山岭隧道 逻辑回归算法 隧道钻爆法施工 预测系统 sigmoid函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号