摘要
本发明涉及人工智能和运筹优化技术领域,公开了一种智能博弈下运筹优化算法开发系统,包括:多层次奖励塑造模块,引导多智能体在稀疏奖励环境中高效探索和学习;信息素间接通信网络模块,实现低开销的协作优化;智能体角色自适应分化模块,形成协同互补的自组织结构;好奇心驱动的探索处理模块,引导多智能体在复杂博弈空间中进行高效探索和开发;纳什均衡与多智能体价值分解模块,构建一种在智能博弈环境下能协调多智能体协作与竞争关系的运筹优化框架;通过多层次奖励塑造系统和好奇心驱动的探索过程使系统在稀疏奖励环境中具备高效探索能力。
技术关键词
预测误差
计算机可读指令
多层次
运筹优化技术
调节单元
通信网络
多智能体协作
多智能体协同
网络单元
模块
算法
策略
动态
增量更新
定义
度量
记忆
可读存储介质
决策