摘要
本发明涉及信息技术技术领域,具体涉及一种基于上下文多臂老虎机模型的自适应推荐方法及系统,方法包括:初始化深度神经网络模型,深度神经网络模型处理商品的上下文特征并计算预测奖励;根据所有待推荐商品的上下文特征计算每个商品的预测奖励;选择预测奖励最高的商品推荐给用户,得到推荐的商品信息;检查被推荐商品的选择次数,并根据选择次数动态调整噪声输入的方差,得到调整后的噪声方差;记录用户对推荐商品的反馈,调整噪声并通过最小化损失函数更新深度神经网络的参数,基于更新后的深度神经网络模型,进行自适应推荐。通过本发明,有效解决了冷启动问题,动态平衡了探索与利用,确保了推荐系统的实时更新和高效计算。
技术关键词
多臂老虎机
深度神经网络模型
上下文特征
推荐方法
噪声方差
噪声强度
动态
信息技术技术
推荐系统
参数更新模块
元学习算法
决策
正则化参数
非线性
索引