摘要
本发明提供了一种高校业务数据处理方法及系统,其属于高校业务数据处理技术领域,包括:获取待评估高校业务系统的产生数据,并进行相应预处理;对所述产生数据,采用基于特征提取和特征工程方法的自动匹配策略获得的特征提取方法及特征工程方法,进行特征提取以及特征工程处理,获得优化后的数据特征表示;基于所述数据特征表示,利用预先训练的用于数据质量评估的机器学习大模型,获得数据质量评估结果;其中,所述数据质量评估结果包括数据的重复性、准确性、完整性以及一致性的多维度指标;基于获得的数据质量评估结果,对高校数据进行数据质量改进。
技术关键词
业务数据处理方法
特征工程方法
特征提取方法
业务系统
重复性
特征提取方式
指标
业务数据处理技术
业务数据处理系统
非暂态计算机可读存储介质
分布式计算框架
数据验证
机器学习库
随机森林模型
数据获取单元
策略
处理器
规模