摘要
本申请公开了一种智慧电厂中数据采集和融合方法、设备及存储介质;该方法包括基于ETW设置数据采集器,通过Kafka将压缩后的数据发送至服务器;服务器设置有多个,服务器基于Dremel的数据模型实现Parquet列式存储格式,对接收到的数据进行融合;多个服务器中,包括一个NameNode节点和多个DataNode节点。数据采集器结合了ETW的高效数据采集、多模型嵌入的数据融合方法以及数据删减算法的优势,能够实现对智慧电厂数据的高效采集、融合和压缩,减少了不必要的数据收集,提高了数据采集的针对性和效率。基于Dremel数据模型的Parquet列式存储,能够实现对数据的快速查询和分析,同时减少不必要的I/O操作和数据扫描。提高了数据的可靠性和可用性。
技术关键词
NameNode节点
数据采集器
服务器
数据处理模块
数据发送模块
处理器
文件存储位置
数据压缩
数据融合方法
建立映射关系
时间片
实体
系统日志
多模型
系统级
计算机设备