摘要
本申请涉及一种将最小熵分桶应用于交叉统计特征的推荐模型训练方法,包括:获取用户的特征信息表和用户与内容集合的交互行为日志;基于二者的交互频次,生成交叉统计特征值;基于交叉统计特征值,构建训练样本集合;对训练样本中的交叉统计特征值序列执行递归分割操作,在递归过程中以最小化条件熵为准则,迭代搜索最优分割点以构造分桶边界;将每个训练样本中的交叉统计特征值映射为分桶编号,并将其和对应标签值共同输入待训练推荐模型中,采用交叉熵损失函数优化待训练推荐模型参数,直至损失函数值收敛输出训练完成的推荐模型。本方法能够显著降低模型的损失函数值,显著提高了点击率预测准确性等关键评估指标。
技术关键词
推荐模型训练方法
训练推荐模型
特征值
画像特征
统计特征
损失函数优化
点击概率预测
标签
样本
计算机程序指令
日志
点击率预测
序列
模型训练模块
计算机程序产品
存储器
处理器