摘要
本发明涉及一种基于强化学习的异步智能体多模式激励联合优化方法,首先构建分层智能体架构,上层模型智能体对应多模式交通网络拓扑模型,下层模型智能体对应出行参与者个体,并分别定义了上层模型和下层模型智能体的动作、状态和奖励值;然后以总成本最小为目标通过迭代训练使上层智能体动态调整激励方案,下层智能体响应激励并反馈交通状态变化。本申请能够全面评估激励方案的有效性及其对个体出行决策的影响,并能在出行需求、电动化率、碳交易价格动态变化情景中动态、快速生成出行激励方案。
技术关键词
路段
联合优化方法
出行方式
网络拓扑模型
公共交通出行
多模式
排放量
小汽车
广义
项目
饱和度
定义
梯度算法
出行需求
因子
网络结构
动态
系统为您推荐了相关专利信息
策略决策单元
多源交通数据
分布式存储模块
清洗策略
数据处理单元
深远海养殖
多能源设备
智能分析方法
趋势预测模型
电力能源系统
情景
路径优化方法
鲁棒优化模型
动态路径优化
交通运行数据
配送优化方法
装卸设备
时间序列预测模型
交通
图谱