将最小熵分桶应用于交叉统计特征的推荐模型训练方法

正文

推荐专利

申请号：CN202511131725

申请日期：2025-08-13

公开号：CN121009371A

公开日期：2025-11-25

类型：发明专利

摘要

本申请涉及一种将最小熵分桶应用于交叉统计特征的推荐模型训练方法，包括：获取用户的特征信息表和用户与内容集合的交互行为日志；基于二者的交互频次，生成交叉统计特征值；基于交叉统计特征值，构建训练样本集合；对训练样本中的交叉统计特征值序列执行递归分割操作，在递归过程中以最小化条件熵为准则，迭代搜索最优分割点以构造分桶边界；将每个训练样本中的交叉统计特征值映射为分桶编号，并将其和对应标签值共同输入待训练推荐模型中，采用交叉熵损失函数优化待训练推荐模型参数，直至损失函数值收敛输出训练完成的推荐模型。本方法能够显著降低模型的损失函数值，显著提高了点击率预测准确性等关键评估指标。

技术关键词

推荐模型训练方法训练推荐模型特征值画像特征统计特征损失函数优化点击概率预测标签样本计算机程序指令日志点击率预测序列模型训练模块计算机程序产品存储器处理器

将最小熵分桶应用于交叉统计特征的推荐模型训练方法

站点导航

APP 下载