摘要
本发明公开了基于人工智能的双渠道供应链的集中式动态决策系统,涉及深度强化学习技术领域,核心包括:策略库模块预存多种策略模型;参数设定模块管理环境参数;智能体管理模块基于参数构建融合生产方和第一销售方的联合智能体,并为每个第二销售方构建普通智能体;策略匹配与调度模块为每个智能体匹配最优策略,即:让智能体分别基于每个策略模型进行单次试运行,根据结果评分并选择最高分模型作为其最优策略;仿真模块则让每个智能体依据其最优策略进行资源分配决策的仿真迭代训练。通过联合智能体与独立智能体组合架构,融合多种强化学习策略,系统能在异构角色协同任务中动态适配最优学习范式,显著提升策略配置自动化程度与部署效率。
技术关键词
动态决策系统
销售方
渠道
深度强化学习算法
深度强化学习技术
资源分配
参数
强化学习策略
状态更新
周期
启发式策略
模块
复杂度
独立智能
预测误差
规模
变量
系统为您推荐了相关专利信息
加密数据
密钥
数据加密方法
系统安全评估
数据加密装置
模型场景
数据收集模块
数据发布
访问控制单元
资源
水声传感网
节点位置预测
深度强化学习算法
环境感知模型
信噪比
路径优化方法
路径优化系统
交易特征
机器学习算法
风险防控策略