摘要
本发明涉及基于马尔科夫博弈的卫星集群观测资源分配方法及系统,通过两阶段分解策略有效解决了任务完整率、资源利用率与费效比的多目标均衡问题。在第一阶段,采用遗传算法(GA)完成卫星‑任务‑时间窗口的三维匹配,实现有限可见窗口的优化分配。第二阶段基于改进的Improved‑MADDPG框架实施分布式决策机制,智能体采用随机博弈策略分布式执行探索后通过全局信息共享与局部策略迭代,达成观测资源的最优动态配置,实现平均奖励值等关键计算指标上的显著提升。
技术关键词
混合整数规划模型
深度强化学习
资源分配方法
集群
遗传算法
资源分配系统
参数初始化方法
资源约束条件
残差神经网络
异构
Softmax函数
编码策略
框架
注意力机制
决策
优化器
系统为您推荐了相关专利信息
负载均衡方法
策略
交换机
隶属度函数
量子傅里叶变换
量子粒子群优化算法
路径规划算法
深度确定性策略梯度
协商机制
加固系统
动作评价方法
强化学习模型
深度强化学习
飞行模拟软件
数据
调控测试方法
工频磁场
电能表
磁场调控
分解算法
移动式充电桩
充电站
调控策略
GAN模型
控制系统