摘要
本申请公开了一种基于强化学习多智能体协同的卫星服务组合选择方法及系统,包括:确定各个样本卫星分别对应的样本卫星剩余资源值,以及样本服务项集合包含的各个样本服务项分别对应的样本服务项资源需求值;将样本服务项集合、样本卫星剩余资源值和样本服务项资源需求值输入第一多智能体强化学习网络模型,得到第一多智能体强化学习网络模型输出的第一联合动作值;基于各个样本服务项资源需求值和各个第一联合动作值,计算第一多智能体强化学习网络模型的损失值;基于损失值,调整第一多智能体强化学习网络模型的第一参数,得到目标多智能体强化学习网络模型。
技术关键词
多智能体强化学习
样本
资源
编码模块
掩码矩阵
多智能体协同
网络
模型训练系统
输入模块
模型训练方法
序列
参数
组合模块
元素
系统为您推荐了相关专利信息
设备状态监测
分析评估方法
传感器节点
异构传感器
大数据
铸件模型
铸件特征
卷积神经网络模型
非暂态计算机可读存储介质
特征提取单元
制定辅助方法
需求预测模型
制定辅助系统
数据收集模块
数据传输单元
运动能力分析
多模态
能力分析方法
数据采集节点
分析器