摘要
本申请公开了一种领导型发电商的定价方法、装置、设备及存储介质。在执行本申请实施例提供的方法时,首先创建了一个模拟环境,用于设置领导型发电商的多次定价模型,随后确定了该发电商的目标定价动作参数,这些参数是可变的。接着,采用基于PRLA算法,根据目标定价动作参数对设定好的模拟环境下的领导型发电商多次定价模型进行竞价模拟演化,最终得到该发电商目标定价动作参数的目标值和目标定价动作参数的目标值下的目标利润。本申请能够灵活地适应复杂多变的市场条件,克服了传统马尔科夫决策过程在动作选择和状态转换上的严格限制。同时,利用基于PRLA算法,有效地优化了决策策略,从而提高了领导型发电商的最终利润。
技术关键词
定价方法
强化学习算法
定价策略
参数
电力
利润
发电量
定价设备
定价装置
变量
可读存储介质
终端设备
处理器
决策
存储器
计算机
指令
因子