摘要
本发明公开了一种基于深度强化学习的多目标资源分配方法,包括步骤:实时场景信息获取与处理;资源分配多目标优化数学模型构建:包括决策变量表示,目标函数构建,约束条件设计;基于深度强化学习的多目标优化设计;结合基于深度强化学习的多目标优化算法求得的最优资源分配方案,为尽可能多的来袭目标分配不同时段的雷达和发射车组合进行目标拦截,从而实现最大化成功拦截概率、最小化拦截成本以及最高的资源利用率的目的。本发明优化目标涵盖提高拦截成功率、降低资源消耗等方面,同时考虑约束条件,形成混合整数线性模型,以实现多目标间的最优平衡;对强化学习方法进行了修改和改进,更准确地满足停止条件。
技术关键词
深度强化学习
资源分配方法
深度神经网络模型
策略
雷达
多头注意力机制
神经网络参数
滚动型
地理位置特征
决策
强化学习方法
蒙特卡洛方法
变量
基准
数学模型
定义
系统为您推荐了相关专利信息
数字孪生系统
动态数据驱动
噪声监测单元
刷新机制
三维实景模型
微生物种群
渔业水体
渔光互补
调控策略
微生物鉴定
数据安全交换系统
密钥管理器
加密支付信息
公钥
私钥
号码
构建时间序列模型
模糊规则
权重分配策略
优化预测模型