一种文件系统的自动化文件数据清洗方法

AITNT
正文
推荐专利
一种文件系统的自动化文件数据清洗方法
申请号:CN202511081882
申请日期:2025-08-04
公开号:CN120610951B
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及自动化文件整合的技术领域,具体涉及一种文件系统的自动化文件数据清洗方法,方法包括:获取类型标识、需求信息、多个文件类型以及每一个文件类型包括的多个待处理合同文件,根据每一个待处理合同文件的数据类型复杂度及数据量,得到对应的文件复杂度;根据每一个待处理合同文件的文件复杂度、文件名及文件内容同需求信息的匹配度,得到对应的需求匹配度;根据每一个待处理合同文件的需求匹配度,确定每一个文件类型对应的关键文件;在多个关键文件中识别基准文件,并基于基准文件对多个待处理合同文件进行数据清洗。本发明能使得多个待处理合同文件获得更好的数据清洗效果,以将PDF格式的合同准确转换为EXCEL格式的文件。
技术关键词
数据清洗方法 复杂度 文件系统 分词 基准 标识 语义 格式
系统为您推荐了相关专利信息
1
一种图像恢复中的集成学习方法
集成学习方法 高斯混合模型 EM算法 实时图像 亮度
2
重要设施知识图谱的构建方法、装置、设备及存储介质
数据获取方法 设施 三元组 分词模型 实体
3
知识库构建方法、装置及知识问答检索方法、装置
文本 SimHash算法 知识库构建方法 问答检索方法 融合方法
4
基于集成学习的多源降水产品融合方法
机器学习模型 融合方法 集成学习模型 站点 评估值计算方法
5
角膜细胞力学与形貌特征耦合驱动的近视分级方法
形貌特征 原子力显微镜 力学 探针 图像分割方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号