摘要
本发明涉及一种基于深度强化学习的个性化奖励分配方法及系统,包括响应于用户通过客户端发起参与奖励分配活动的请求,通过分布式数据采集框架采集用户的特征数据和奖励池信息,并进行标准化处理以生成结构化输入数据;利用深度强化学习模型处理结构化输入数据,生成个性化奖励分配概率,并通过约束优化算法确保分配成本满足预设预算约束;根据个性化奖励分配概率,采用随机化算法执行用户请求的奖励分配并返回分配结果。本发明通过深度强化学习实现个性化奖励分配,显著提升用户参与度和满意度;分布式数据处理和在线学习机制确保实时性和动态适应性;约束优化算法有效控制分配成本,适合大规模应用。
技术关键词
奖励分配方法
深度强化学习模型
分布式数据采集
约束优化算法
在线学习算法
分布式数据处理
深度神经网络
项目
流式数据处理技术
处理器上执行程序
数据采集模块
在线学习机制
客户端
统计学特征
归一化算法
分布式数据库
框架