摘要
本公开实施例涉及一种样本数据处理方法、装置、设备、存储介质和程序产品。该方法包括:获取待查询的数据关键字段;基于数据关键字段查询目标数据源,确定目标查询数据;其中,目标数据源包括离线数据源、近线数据源和在线数据源中的至少一个;基于目标查询数据生成目标样本数据,并将目标样本数据存储至离线数据源、近线数据源和在线数据源中的样本数据表。根据本公开实施例,实现了同时对在线、近线和离线的三个数据源的访问,并统一了对三个数据源中的数据的解析与基本处理逻辑,解决了在近离三线不一致的问题,保证了算法模型在训练过程和推理过程中输入数据的一致性。
技术关键词
样本数据处理方法
关键字
样本数据处理装置
在线
离线
计算机程序产品
数据存储
处理器
算法模型
存储模块
可读存储介质
指令
消息
存储器
电子设备
逻辑
系统为您推荐了相关专利信息
发放系统
多模态生物特征融合
学习异常检测
哈希值生成装置
LSTM神经网络
合同生成方法
大语言模型
模板
文本
合同生成技术
教育机器人
智能推荐方法
个性化推荐课程
学生
深度优先搜索
建筑碳排放实时在线监测系统
编码向量
变量
检测箱体
时序特征