摘要
本申请公开了一种应用推荐方法、装置及电子设备,涉及大数据技术领域。方法包括:获取用户的行为数据;行为数据中包括动作策略;利用预先训练好的应用推荐模型,基于行为数据计算动作效用值;动作效用值基于应用推荐模型中的强化学习算法得到,用于表征当前动作策略的倾向程度;根据动作效用值,进行应用推荐。与相关技术相比而言,通过预先训练好的应用推荐模型和其中的强化学习算法,计算动作效用值,体现当前状态下用户可能做出的动作策略的倾向性,最后根据动作效用值,进行应用推荐。通过强化学习算法来计算用户对不同策略的倾向性,提高了应用推荐的精准度,解决目前应用推荐决策精准度不够,推荐效率低下的问题。
技术关键词
动作策略
强化学习算法
推荐方法
建立映射关系
电子设备
处理器
大数据技术
计算机程序产品
推荐装置
仿真器
可读存储介质
处理单元
因子
决策