摘要
本发明提供一种温室的水肥决策模型的训练方法、装置,该方法包括:获取多智能体的待决策数据,多智能体包含温室的各区域;以所述多智能体为节点,基于待决策数据构建第一图结构,基于初始水肥决策模型中的图注意力网络层确定图结构融合特征,并基于图结构融合特征,确定各智能体的水肥决策;以最大化所述各智能体的决策奖励为目标,对初始水肥决策模型进行优化,以得到最终的水肥决策模型。本发明提供的方法,基于待决策数据构建第一图结构,基于图注意力网络得到图结构融合特征,提升对数据的处理能力。通过多智能体强化学习对模型进行优化,以得到更协调的水肥决策,提升水肥利用率。
技术关键词
决策
水肥
融合特征
温室
协调优化策略
数据
注意力机制
多智能体强化学习
图像设备
非暂态计算机可读存储介质
节点
处理器
计算机程序产品
学习算法
非线性
训练装置
网络
传感器
存储器