摘要
本申请提供一种非结构化数据的预处理方法、电子设备、可读存储介质及计算机程序产品,该方法包括:识别非结构化数据的分层维度,并基于分层维度确定分层标准;基于分层标准对非结构化数据进行分层处理,得到分层数据;识别分层数据的数据特性,并基于数据特性确定对应的分块算法和分块大小;基于分块算法和分块大小对分层数据进行分块处理,得到分块数据;对分块数据进行去重处理,得到预处理数据。该方法能够确保系统能够灵活应对多种数据格式的存储需求,从而保障数据存储效率,降低存储成本和管理难度。
技术关键词
分块算法
分层
计算机程序产品
计算机程序指令
数据识别模型
数据存储效率
可读存储介质
数据访问
电子设备
场景
存储计算机程序
处理器
数据格式
指针
存储器
频率
实体
定义
系统为您推荐了相关专利信息
数据管理系统
代码开发工具
访问控制策略
数据加密算法
管理功能模块
同杆双回线路
高压输电线路故障
支持向量机算法
SMOTE算法
样本
分层控制方法
储能并网系统
驱动信号
分层协同控制
有功功率
高分辨率数值
数据驱动模型
网格节点信息
湍流模型
壁面区域