一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法

AITNT
正文
推荐专利
一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法
申请号:CN202410929534
申请日期:2024-07-11
公开号:CN118780836A
公开日期:2024-10-15
类型:发明专利
摘要
本发明提出了一种融合样本扩增和双值深度确定性策略梯度算法的充电站动态定价方法,即D3PGSA,以解决单个充电站的动态定价问题。该算法通过融合经验生成模型和基于特征生成模型的DBCSAN聚类方法,以及双值网络,来实现Agent策略网络的高效学习,进而实现价格的合理调控,为动态定价决策提供了坚实的理论基础。首先,经验生成模型的引入增强了用于Agent训练的样本的多样性,有效克服了传统DDPG中经验样本利需求量高问题。通过构建基于特征生成模型的DBCSAN聚类方法,模型能够在经验回放机制中更好地平衡不同类别样本的使用,以上改进使得模型在未见状态下也能做出高质量的决策。其次,本发明采用了双值网络,分别对目标值进行估计,这种设计有效减少了单一估计网络可能带来的误差,提高了模型训练的稳定性和鲁棒性。通过这些改进,D3PGSA不仅提升了模型对复杂环境的适应能力,还提高了定价策略的准确性和效率。实验结果表明,D3PGSA在大多数情况下能够灵活调整价格,以响应市场需求,获取的收益值显著优于其他算法,并且在求解速度和求解精度方面表现出色。这些优势使得D3PGSA成为充电站动态定价问题中一个高效且实用的解决方案。
技术关键词
充电站 动态定价方法 样本 网络 定价策略 决策 DBSCAN算法 邻域 随机噪声 定义 聚类 中间层 核心 参数 充电桩数量
系统为您推荐了相关专利信息
1
船舶运行模型训练方法和船舶运行控制方法
船舶运行控制方法 网格 模型训练方法 主成分分析算法 特征值
2
基于自注意力网络的遥感图像城市景观分类方法及系统
注意力 图像块 分类方法 遥感图像数据 景观
3
一种面向大语言模型处理极长文本的推理运行加速方法
注意力 大语言模型 矩阵 文本 流水线并行计算
4
光网络资源3d故障定位管理方法及系统
定位管理方法 显示导航信息 光网络 图像 链路
5
一种多模态神经网络模型流式计算方法
神经网络模型 流式计算方法 训练神经网络 场景特征 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号