摘要
本发明提供一种碳积分定价模型的构建方法及装置,属于强化学习技术领域,所述方法包括:利用DDPG算法构建强化学习模型;设置强化学习模型进行学习训练所需的环境;根据强化学习模型与环境之间的不断交互,生成多个经验元组,并将多个经验元组存储至经验池中;基于经验池中的经验元组对强化学习模型进行训练,直到强化学习模型收敛;从收敛的强化学习模型中抽取出Actor网络,作为碳积分定价模型,以根据每类碳积分出售方的碳积分数量,确定针对每类碳积分出售方的碳积分定价。本发明提供的碳积分定价模型的构建方法及装置,不仅能够提供更科学合理的碳积分定价方案,还能促进整个碳市场的健康发展。
技术关键词
强化学习模型
网络架构
训练样本数据
变量
聚类算法
非暂态计算机可读存储介质
强化学习技术
主成分分析法
处理器
计算机程序产品
收入
模块
存储器
电子设备
系统为您推荐了相关专利信息
系统优化方法
护栏结构
综合性
拉丁超立方采样
碰撞工况
环保型铝合金
半固态铸造
无铬表面
电磁感应加热熔炉
原料预处理
平直度偏差
焊缝
多层次特征
数据获取模块
深度学习模型
船舶轨迹规划方法
强化学习模型
模仿学习方法
强化学习策略
电子海图