摘要
本申请公开了一种音乐推荐模型训练样本生成方法、设备、介质及产品,涉及大数据领域,应用于与预设数据湖连接的计算引擎,计算引擎和预设数据湖支持流批一体;包括:获取目标音乐的实时推荐特征数据;若监测到目标音乐的首次用户行为实时数据则生成第一数据类型标签并注册定时器;在定时时长内获取非首次用户行为实时数据并生成第二数据类型标签;若定时时长结束,则将实时推荐特征数据、第一数据类型标签以及第二数据类型标签均拼接至同一数据样本并上报至预设数据湖,以便音乐推荐模型利用数据样本进行在线和/或离线模型训练。本申请采用流批一体的数据湖存储拼接好的实时样本,可以同时支持流式实时训练和批式离线训练,实现了流批一体。
技术关键词
音乐推荐模型
训练样本生成方法
实时数据
标签
训练样本数据
客户端
定时器
音乐推荐方法
列表
离线
存储计算机程序
计算机程序产品
处理器
电子设备
在线
字段
可读存储介质