一种通用的并行海量数据处理方法

AITNT
正文
推荐专利
一种通用的并行海量数据处理方法
申请号:CN202510535841
申请日期:2025-04-27
公开号:CN120407583A
公开日期:2025-08-01
类型:发明专利
摘要
本申请涉及数据处理技术领域,提供一种通用的并行海量数据处理方法,步骤S1:构造布隆过滤器的位图;步骤S2:计算布隆过滤器的第一哈希函数的个数;步骤S3:配置HLL++算法的第二哈希函数;步骤S4:基于数据标识查询数据处理状态;步骤S5:处理数据,将数据标识登记至布隆过滤器的位图和HLL++算法的桶;步骤S6:执行步骤S4直至所有数据均被处理。本申请可简单增加并行处理节点提升系统处理能力,同时依靠数据处理状态服务极大降低系统处理重复数据的几率,进一步提高数据处理的效率,同时通过配置的算法提高数据处理的准确性。相比传统穿行数据处理方案,本申请具有扩展性好、硬件要求低、资源利用率高等特点。
技术关键词
布隆过滤器 海量数据处理系统 索引 数据源获取数据 标识 算法 数据处理技术 提升系统 节点 识别码 元素 模块 摘要 内存 误差 资源
系统为您推荐了相关专利信息
1
激活码的查询方法、装置、电子设备及可读存储介质
标识 查询设备 标签 主板 关系
2
数字孪生城市领域几何数据简化表达方法
表达方法 简化方法 关键点 节点 计算机程序产品
3
基于大语言模型的表格问答方法、设备、介质及程序产品
大语言模型 表格 问答方法 计算机程序指令 单轮
4
一种基于多级规则的星上处理任务智能调度方法及装置
智能规划系统 时效性 智能调度方法 卫星观测数据 智能调度模型
5
一种基于大模型的食品行业用环保管理方法及系统
大语言模型 实时数据 报告 环保管理系统 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号