摘要
本发明公开了一种用于新能源场站数据处理的模型优化方法及系统,根据已有的数据样本建立深度Q网络强化学习模型,通过基于当前的状态选择动作计算奖励函数,设计奖励函数以衡量算法的性能,根据数据恢复的准确性、对场站运行决策的帮助程度等因素来确定奖励,在训练过程中,通过计算每条经验的TD误差,使用优先经验回放,根据经验的重要性进行抽样,给予重要的经验更高的被抽取概率,从而使模型更快地学习到关键的信息,同时,在训练过程中,随机从缓冲区中抽取小批量的经验进行学习,可以打破数据的相关性,最后通过迭代更新,完成模型的优化训练,本发明获取的模型能够解决采集新能源场站数据过程中的数据缺失等噪声问题。
技术关键词
新能源场站
模型优化方法
模型优化系统
时间序列模型
强化学习模型
误差
深度Q网络
定义
可读存储介质
贪心策略
参数
数据获取模块
策略更新
处理器
谐波
终端设备
批量