一种基于多智能体强化学习的供应链自动化合约代理方法

正文

推荐专利

申请号：CN202510161946

申请日期：2025-02-14

公开号：CN119648406B

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开了一种基于多智能体强化学习的供应链自动化合约代理方法，步骤为：S1：根据斯塔克尔伯格模型和鲁宾斯坦模型具体建模供应链交易的两种典型场景；S2：通过斯塔克尔伯格模型和鲁宾斯坦模型获取专家经验，对智能体行为员网络进行基于专家经验的预训练；S3：根据博弈特性引入基于对手策略的价值预测、应用时序模型进行历史交易序列的特征提取、优先级经验回放机制，逐步优化智能体的策略。本发明显著提升了算法性能，处理复杂和动态的谈判任务，增强了智能体的前瞻性决策能力，加速了在训练初期的学习过程，在学习过程更专注于重要的经验，提升了整体的学习效率和策略成熟度。

技术关键词

多智能体强化学习代表利润决策网络优化位置依赖信号策略网络模型样本协议游戏因子更新模型参数 LSTM模型机制方程序列特征时序

系统为您推荐了相关专利信息

一种开放世界和分布外泛化的统一模型构建方法

模型构建方法训练样本数据逻辑回归模型三元组学习算法

一种基于云计算的数据交互调度平台

历史运行数据需求预测模型决策树模型特征选择资源分配策略

大规模路网区域间热点路径识别方法

路径识别方法车牌识别数据单车局部敏感哈希算法行程

基于脑电的视性错觉可解释性智能评估方法

视性错觉智能评估方法脑网络特征电信号训练样本集

一种面向公共机构空调能耗管理系统

能耗管理系统样本短期负荷预测计算方法数学模型

一种基于多智能体强化学习的供应链自动化合约代理方法

站点导航

APP 下载