摘要
本申请提供一种基于安全数据沙箱的结构化数据分层抽样的方法、系统、设备及介质,属于数据分析技术领域,所述方法:使用安全数据沙箱对接数据提供方的数据源,确定数据源的元数据信息;响应分层请求确定分层字段,在安全数据沙箱内根据分层字段确定分层及每层的抽样策略,并允许对每层的抽样策略进行单独修改;按照每层的抽样策略安全数据沙箱内对数据源进行分层抽样,再对每层的抽样数据进行合并;使用合并的抽样数据在安全数据沙箱内训练数据分析模型,再使用数据分析模型对数据源的全量数据进行分析。本发明通过分层抽样,提升数据分析的准确性和效率,降低数据处理成本;允许对每层的抽样策略进行单独修改,增加灵活性和适应性。
技术关键词
沙箱
数据分析模型
字段
数据分析技术
分层策略
处理器
标记
样本
模块
存储器
参数
电子设备
介质
程序