摘要
本发明提供一种基于强化学习算法的动态陈列调整方法及系统,涉及动态陈列技术领域,包括获取目标场所的历史数据,并按照时间序列进行排序,基于因果表示学习构建销售预测模型,通过因果驱动的预测算法得到销售预测值;构建商品关联模型,基于预设的不同商品之间的关联规则,通过计算商品相似度,确定互补关系和替代关系,计算商品推荐得分;以商品的当前陈列数据为基础,确定状态空间;基于商品的陈列动作,确定动作空间;确定奖励函数,构建动态陈列模型;确定待调整的状态特征,输入动态陈列模型,通过计算动作的概率分布,结合探索衰减因子和软化因子,从动作空间中选择最优动作,确定最优动态陈列策略,进行陈列调整。
技术关键词
销售预测模型
强化学习算法
因子
动态
文本特征向量
图像特征向量
矩阵
计算机程序指令
深度神经网络
商品特征
偏好特征
关系
数据
策略
融合特征
陈列技术
梯度下降算法
序列