摘要
本发明公开了一种基于竞争环境的联合库存控制和动态定价的决策方法,涉及联合决策技术领域,包括步骤:采集基础信息;计算基准价格、基准需求;搭建并初始化深度神经网络;构造经验回放池;为当前状态st选择一个动作at,并执行动作at,得到状态st+1;计算每个对象的需求量;利用状态st和动作at,结合需求量,计算奖励值rt;构造状态转移并存入经验回放池;从经验回放池中选择样本,利用训练网络和目标网络计算训练Q值和目标Q值,以更新训练网络;重复对训练网络进行训练;定期将训练网络同步至目标网络;利用目标网络为第一对象生成最优策略。最终实现在竞争环境下进行联合库存控制与动态定价,最大化预期销售总利润。
技术关键词
决策方法
对象
动态
基准
样本
深度神经网络
网络同步
数据
周期
时间段
超参数
基础
策略
利润
索引
序列
系统为您推荐了相关专利信息
TCGA数据库
标记方法
肝癌
深度学习模型
异常数据
铅酸电池充电装置
可控开关
电压检测模块
升压模块
低压电源模块
数据安全管理方法
身份认证机制
数据流分析方法
机器学习算法
审计日志数据
负载预测方法
预测模型训练
梯度下降法
训练预测模型
动态特征选择