一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法

正文

推荐专利

申请号：CN202410929534

申请日期：2024-07-11

公开号：CN118780836A

公开日期：2024-10-15

类型：发明专利

摘要

本发明提出了一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法，即D3PGSA，以解决单个充电站的动态定价问题。该算法通过融合经验生成模型和基于特征生成模型的DBCSAN聚类方法，以及双值网络，来实现Agent策略网络的高效学习，进而实现价格的合理调控，为动态定价决策提供了坚实的理论基础。首先，经验生成模型的引入增强了用于Agent训练的样本的多样性，有效克服了传统DDPG中经验样本利需求量高问题。通过构建基于特征生成模型的DBCSAN聚类方法，模型能够在经验回放机制中更好地平衡不同类别样本的使用，以上改进使得模型在未见状态下也能做出高质量的决策。其次，本发明采用了双值网络，分别对目标值进行估计，这种设计有效减少了单一估计网络可能带来的误差，提高了模型训练的稳定性和鲁棒性。通过这些改进，D3PGSA不仅提升了模型对复杂环境的适应能力，还提高了定价策略的准确性和效率。实验结果表明，D3PGSA在大多数情况下能够灵活调整价格，以响应市场需求，获取的收益值显著优于其他算法，并且在求解速度和求解精度方面表现出色。这些优势使得D3PGSA成为充电站动态定价问题中一个高效且实用的解决方案。

技术关键词

充电站动态定价方法样本网络定价策略决策 DBSCAN算法邻域随机噪声定义聚类中间层核心参数充电桩数量

系统为您推荐了相关专利信息

船舶运行模型训练方法和船舶运行控制方法

船舶运行控制方法网格模型训练方法主成分分析算法特征值

基于自注意力网络的遥感图像城市景观分类方法及系统

注意力图像块分类方法遥感图像数据景观

一种面向大语言模型处理极长文本的推理运行加速方法

注意力大语言模型矩阵文本流水线并行计算

光网络资源3d故障定位管理方法及系统

定位管理方法显示导航信息光网络图像链路

一种多模态神经网络模型流式计算方法

神经网络模型流式计算方法训练神经网络场景特征参数

一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法

站点导航

APP 下载