摘要
本发明提供一种基于分层强化学习的车网多维资源弹性调度方法,包括:将车网系统目标区域内的每一目标CS建模为一个智能体;确定目标区域内CS‑ICV‑用户端交互过程中电力资源和算力资源调度的优化问题,以所有智能体在调度时间段内的总收益最大化为目标,构建目标函数,确定目标函数的约束条件;构建多智能体模型,多智能体模型包括上层和下层,上层用于对电力资源调度的优化问题进行求解,下层用于对算力资源调度的优化问题进行求解;利用多智能体模型,基于每一智能体在调度时间段内的观测状态,在约束条件下对目标函数进行求解,得到最优调度策略。本发明提高了多维资源调度的灵活性,能够在复杂场景下实现多维资源的合理分配。
技术关键词
弹性调度方法
分层强化学习
多智能体模型
周期
资源
电力
车网系统
时间段
关系
智能网联汽车
样本
网络
功率
阶段
充电站
策略
参数
决策
数据
标签
系统为您推荐了相关专利信息
异常状态
故障检测方法
进程
机器人系统
计算机程序指令
电力传输设备
组网模型
数值
组网管理方法
监控服务器
智能服务终端
大语言模型
屏幕显示模块
鼾声检测
姿势识别
作业现场
三维虚拟场景
风险信息评估方法
动画
勘测机器人