摘要
本发明公开了一种基于聚类状态空间降维的Q‑learning电动汽车群体充电调度方法,涉及电动汽车集群调度技术领域,先基于用户充电意愿和电动汽车集群充电功率确定调度范围,再构造马尔科夫决策模型,接着在强化学习算法中嵌入K‑means聚类的状态空间降维模块得到聚类强化学习算法,最后求解模型输出最优调度策略;本发明能通过聚类将高维状态空间压缩至常数复杂度,解决传统强化学习在大规模电动汽车群协同调度中的“维度灾难”问题,且采用非神经网络推理架构,在计算效率与数据利用上优势显著,既降低硬件资源消耗与部署成本,又能在小样本条件下快速收敛,减少对训练数据规模的依赖。
技术关键词
充电调度方法
充电站
聚类强化学习
强化学习算法
集群调度技术
贪心策略
差分算法
决策
曲线
神经网络推理
充放电动作
初始聚类中心
功率
样本
电池
定义
速率
系统为您推荐了相关专利信息
智能推荐系统
商品特征
电商
长短期记忆网络
分布式数据库
智能化方法
LSTM模型
电网资源调度
电力通信网
通信资源分配
交通流预测
交叉口
长短期记忆神经网络
联合仿真平台
智能交通信号控制技术
协同优化控制方法
充电站
气象
模式
优化控制系统
车辆轨迹数据
自动标定方法
雷达
标定误差
动态误差