摘要
本申请实施例提供了一种消息推送方法、系统、电子设备、存储介质及程序产品,涉及计算机技术领域。消息推送方法包括:根据目标用户的货源消息队列中的待推送货源消息列表,以及所述目标用户的特征信息,确定所述目标用户的状态特征,并从所述待推送货源消息列表中确定目标货源消息;将所述用户的状态特征发送至预置的离线强化学习模型,并获取所述预置的离线强化学习模型返回的目标频控间隔;根据所述目标频控间隔,向所述目标用户推送所述目标货源消息。本申请实施例能够提供一种可以减少无效推送,且能够优化用户长期体验的技术方案。
技术关键词
强化学习模型
离线
消息推送方法
计算机程序指令
列表
调度器
电子设备
消息推送系统
队列
Q学习算法
日志
画像
存储计算机程序
计算机程序产品
处理器
可读存储介质
决策
存储器
系统为您推荐了相关专利信息
传输网络业务
资源关联关系
业务关联关系
业务关联信息
对象
群体智能优化算法
深度生成对抗网络
设计特征
深度强化学习模型
图标