摘要
本发明提供一种融合深度强化学习的温室环境优化控制方法及装置,其中方法包括:在慢时间尺度通过强化学习算法训练获取作物生长状态轨迹、控制输入轨迹以及温室环境状态轨迹,用于反演得到协状态轨迹;将作物生长状态轨迹和协状态轨迹添加至快时间尺度控制的控制目标,通过强化学习算法求得快时间尺度控制的初始猜测,通过优化控制算法对初始猜测进行优化,确定对待控制温室进行最终控制的短时域控制决策序列。利用强化学习智能体的快速决策能力,突破优化控制“维数灾难”瓶颈并提高控制实时性,通过优化控制对智能体决策进行优化和机理解释,实现对温室环境进行精准快速控制以确保经济效益最大化。
技术关键词
作物生长状态
深度强化学习
强化学习算法
温室
轨迹
优化控制算法
决策
序列
非暂态计算机可读存储介质
神经网络模型训练
控制模块
策略
处理器
计算机程序产品
执行机构
通风
调节器
存储器
系统为您推荐了相关专利信息
标准单元
深度强化学习
布局优化方法
机器可读存储介质
视觉特征
设备控制方法
电脑主板
记忆
动态权重分配
设备控制系统