摘要
一种基于多智能体深度强化学习算法的电力期货交易策略设计方法和系统,其方法包括:S1、采集电力期货市场中多种电力期货历史交易数据;S2、定义多智能体深度强化学习中Daul‑Q MADDPG算法的智能体动作与动作空间、状态与状态空间、奖励函数、折扣率等参数;S3、Daul‑Q MADDPG算法进行训练,直至算法训练成熟,多智能体获得的市场总收益保持稳定;S4、市场参与者基于电力期货市场的交易情况,采集多种电力期货的实时交易数据;S5、利用S3中训练成熟的Daul‑Q MADDPG算法做出决策,对多个智能体的动作进行拼接,得到电力期货的组合投资策略。本发明解决了深度强化学习中的高估问题,降低了批判目标网络对价格波动的敏感性,有利于在较长的时间跨度内获得更高的总体收益,降低电力期货的经验门槛。
技术关键词
策略设计方法
电力
利润
算法
基准
深度强化学习
定义
决策
数据采集模块
周期
日期
企业
设计系统
处理器
资金
参数
可读存储介质