摘要
本发明涉及强化学习技术领域,具体涉及基于强化学习的农业虚实交互决策系统及自优化方法。该方法通过农田数字孪生模型引入随机交互事件分析决策动作执行的贡献增益,从状态信息覆盖程度与历史动作有效性评估执行质量,并通过状态变化得到动态影响变量;通过交互事件的阈值触发向量的联合路径触发分析,得到交互事件的基本触发概率,依据执行质量和动态影响变量修正,并结合交互事件的延时触发得到最终触发概率;综合最终触发概率与增益,得到决策动作的贡献增益量优化决策方案。本发明通过更精准的模拟决策动作对农田的即时影响,引入交互事件的分析提高决策动作贡献的准确度,减小时序上的因果割裂和贡献混淆,使优化决策方案更可信。
技术关键词
决策系统
农田
农业
变量
数字孪生模型
指标
动态
有效性
强化学习技术
数据采集频率
动作智能
矩阵
有向无环图
节点
网络分析
处理器
信息熵
密度