一种基于多智能体强化学习的供应链自动化合约代理方法

AITNT
正文
推荐专利
一种基于多智能体强化学习的供应链自动化合约代理方法
申请号:CN202510161946
申请日期:2025-02-14
公开号:CN119648406B
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于多智能体强化学习的供应链自动化合约代理方法,步骤为:S1:根据斯塔克尔伯格模型和鲁宾斯坦模型具体建模供应链交易的两种典型场景;S2:通过斯塔克尔伯格模型和鲁宾斯坦模型获取专家经验,对智能体行为员网络进行基于专家经验的预训练;S3:根据博弈特性引入基于对手策略的价值预测、应用时序模型进行历史交易序列的特征提取、优先级经验回放机制,逐步优化智能体的策略。本发明显著提升了算法性能,处理复杂和动态的谈判任务,增强了智能体的前瞻性决策能力,加速了在训练初期的学习过程,在学习过程更专注于重要的经验,提升了整体的学习效率和策略成熟度。
技术关键词
多智能体强化学习 代表 利润 决策 网络优化 位置依赖信号 策略网络模型 样本 协议 游戏 因子 更新模型参数 LSTM模型 机制 方程 序列特征 时序
系统为您推荐了相关专利信息
1
一种开放世界和分布外泛化的统一模型构建方法
模型构建方法 训练样本数据 逻辑回归模型 三元组 学习算法
2
一种基于云计算的数据交互调度平台
历史运行数据 需求预测模型 决策树模型 特征选择 资源分配策略
3
大规模路网区域间热点路径识别方法
路径识别方法 车牌识别数据 单车 局部敏感哈希算法 行程
4
基于脑电的视性错觉可解释性智能评估方法
视性错觉 智能评估方法 脑网络特征 电信号 训练样本集
5
一种面向公共机构空调能耗管理系统
能耗管理系统 样本 短期负荷预测 计算方法 数学模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号