摘要
本公开提供了一种基于双层嵌套进化强化学习的智能决策方法及系统,该方法包括:基于进化学习算法初始化目标任务场景对应的任务配置种群;任务配置种群包括多个种群个体,每个种群个体均设置有第一配置网络和第一动作网络;多次执行种群优化操作,直至任务配置种群中的精英个体变为固定;基于精英个体对应的第一配置网络和第一动作网络确定目标任务场景的决策结果;种群优化操作包括:计算每个种群个体对应的适应度;基于每个种群个体对应的适应度将多个种群个体划分为精英个体和非精英个体;基于精英个体和强化学习算法更新任务配置种群中的非精英个体。本公开提供的基于双层嵌套进化强化学习的智能决策方法及系统可以提高辅助决策的有效性。
技术关键词
强化学习网络
配置网络
智能决策方法
强化学习算法
智能决策系统
嵌套
场景
输出模块
有效性
数据
系统为您推荐了相关专利信息
中央空调智能
节能控制方法
混合深度学习模型
冷热源设备
调控策略
航迹规划方法
无人机
多传感器融合系统
视觉SLAM技术
运动状态参数
教育系统
优化查询方法
深度强化学习模型
节点
查询策略
学前教育互动系统
互动方法
大数据
直方图均衡化
图像数据采集模块