摘要
本发明提出了一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法,即D3PGSA,以解决单个充电站的动态定价问题。该算法通过融合经验生成模型和基于特征生成模型的DBCSAN聚类方法,以及双值网络,来实现Agent策略网络的高效学习,进而实现价格的合理调控,为动态定价决策提供了坚实的理论基础。首先,经验生成模型的引入增强了用于Agent训练的样本的多样性,有效克服了传统DDPG中经验样本利需求量高问题。通过构建基于特征生成模型的DBCSAN聚类方法,模型能够在经验回放机制中更好地平衡不同类别样本的使用,以上改进使得模型在未见状态下也能做出高质量的决策。其次,本发明采用了双值网络,分别对目标值进行估计,这种设计有效减少了单一估计网络可能带来的误差,提高了模型训练的稳定性和鲁棒性。通过这些改进,D3PGSA不仅提升了模型对复杂环境的适应能力,还提高了定价策略的准确性和效率。实验结果表明,D3PGSA在大多数情况下能够灵活调整价格,以响应市场需求,获取的收益值显著优于其他算法,并且在求解速度和求解精度方面表现出色。这些优势使得D3PGSA成为充电站动态定价问题中一个高效且实用的解决方案。
技术关键词
充电站
动态定价方法
样本
网络
定价策略
决策
DBSCAN算法
邻域
随机噪声
定义
聚类
中间层
核心
参数
充电桩数量
系统为您推荐了相关专利信息
船舶运行控制方法
网格
模型训练方法
主成分分析算法
特征值
神经网络模型
流式计算方法
训练神经网络
场景特征
参数