摘要
本发明提出了一种基于双向Transformer的对抗训练和对比学习序列推荐方法,包括以下步骤:获取数据集,对数据集进行预处理;用预处理过的数据集预训练生成模型;生成模型生成样本,用生成样本和从训练集采集样本组合预训练判别模型;通过强化学习和策略梯度使生成器和判别器进行对抗训练;采用对比学习方法辅助对抗训练,通过联合优化迭代更新直至生成模型收敛至最佳状态;将测试集放入训练好的生成模型生成序列推荐列表。本发明使用双向Transformer模型,通过策略梯度的对抗训练和对比学习方法,使其能够更准确地捕捉用户偏好和序列上下文的关系,提升推荐效果。
技术关键词
序列推荐方法
训练判别模型
样本
项目
训练集
策略
学习方法
蒙特卡洛算法
列表
随机梯度下降
参数
数据分布
度函数
度量
批量
线性
系统为您推荐了相关专利信息
车辆控制策略
网络
记忆模型
生成模型训练方法
序列
虚拟对象
混合现实设备
施工设备
风险评估方法
场景