摘要
本发明公开了基于深度强化学习的智能目标分配方法及系统,具体涉及多智能体系统领域,用于解决动态对抗模拟场景中多维度约束下的实时决策问题,是通过构建时序依赖图、栅格化通行矩阵和容量平衡表,将时间、空间和资源约束分解为独立模型,降低多智能体系统在动态对抗场景中的决策复杂度;借助自适应蒙特卡洛采样、预测感知路径规划和动态阈值资源分配,快速生成多样化高质量候选方案;环境变化时,利用多层影响传播网络和空间拓扑关系图谱定位受影响智能体,通过局部调整生成方案片段,避免全局重计算,减少开销,确保实时响应;同时,通过资源时延耦合和路径效率综合评估,结合多目标优化与任务一致性验证,筛选出高效可靠的最优解。
技术关键词
深度强化学习
空间拓扑关系
线性时序逻辑
动态障碍物
蒙特卡洛
多智能体系统
贪婪策略
时延
资源分配
指数
栅格
时间域
松弛
时序依赖关系
检查器
算法
序列
系统为您推荐了相关专利信息
深度强化学习
平衡方法
网络模型结构
数学模型
工作站执行
气流发生器
障碍物
规划
生成无人机
深度强化学习技术
蒙特卡洛
粒子
组织
短波近红外波段
动态剪切流变仪
弹性配电网规划方法
配电网规划模型
风光储联合
场景
蒙特卡洛模拟法