摘要
本发明公开了一种基于正交分解表示的多智能体控制方法与装置,方法包括:接收上层调度系统实时提供的智能体的局部观测和任务上下文;根据所述智能体的局部观测生成对应的原始特征矩阵,并对所述原始特征矩阵执行正交化,得到对应的正交基矩阵;根据所述任务上下文生成权重;根据所述正交基矩阵和所述权重计算任务特定表示;将所述任务特定表示输入全连接层,输出智能体动作值函数来衡量观测‑动作的价值,选择价值估计最大时对应的动作。
技术关键词
智能体控制方法
混合网络
体控制装置
矩阵
超网络
多层感知机
调度系统
参数
人工神经网络
多任务
动态
策略更新
控制策略
数据
离线
时序
因子
机制
系统为您推荐了相关专利信息
温度估计方法
气液动力学模型
数据采集模块
扩展卡尔曼滤波算法
冷媒
注意力神经网络
动态预测方法
动态预测模型
数据
周期
安装误差标定方法
安装误差角
概率密度函数
协方差矩阵
卡尔曼滤波
监督学习技术
混合高斯模型
连续实时监测
监督学习方法
神经网络结构