非结构化数据的预处理方法、设备、介质及程序产品

AITNT
正文
推荐专利
非结构化数据的预处理方法、设备、介质及程序产品
申请号:CN202411917537
申请日期:2024-12-24
公开号:CN119690351A
公开日期:2025-03-25
类型:发明专利
摘要
本申请提供一种非结构化数据的预处理方法、电子设备、可读存储介质及计算机程序产品,该方法包括:识别非结构化数据的分层维度,并基于分层维度确定分层标准;基于分层标准对非结构化数据进行分层处理,得到分层数据;识别分层数据的数据特性,并基于数据特性确定对应的分块算法和分块大小;基于分块算法和分块大小对分层数据进行分块处理,得到分块数据;对分块数据进行去重处理,得到预处理数据。该方法能够确保系统能够灵活应对多种数据格式的存储需求,从而保障数据存储效率,降低存储成本和管理难度。
技术关键词
分块算法 分层 计算机程序产品 计算机程序指令 数据识别模型 数据存储效率 可读存储介质 数据访问 电子设备 场景 存储计算机程序 处理器 数据格式 指针 存储器 频率 实体 定义
系统为您推荐了相关专利信息
1
数据管理系统的创建方法、装置、设备、介质和产品
数据管理系统 代码开发工具 访问控制策略 数据加密算法 管理功能模块
2
基于小波包能量比值的高压输电线路故障识别方法、装置、电子设备、存储介质及计算机程序
同杆双回线路 高压输电线路故障 支持向量机算法 SMOTE算法 样本
3
光伏并网场景下的低电压穿越分层控制方法及装置
分层控制方法 储能并网系统 驱动信号 分层协同控制 有功功率
4
基于数据驱动预测的壁面函数湍流模拟方法及装置
高分辨率数值 数据驱动模型 网格节点信息 湍流模型 壁面区域
5
产品资源评估方法、装置、设备、存储介质和程序产品
瑕疵 资源评估模型 资源评估方法 评价特征 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号