摘要
本发明涉及一种经验权重更新和时延敏感奖励的多任务群体感知方法,所述方法包括以下步骤:步骤1、仿真平台进行算法的初始化;步骤2、指挥中心初始化环境;步骤3、仿真平台根据当前保存的任务分配器策略π进行任务分配;步骤4、根据当前保存的时序预测器参数ψ对每个个体经验缓冲区中的紧急任务兴趣点进行更新等步骤;所述方法的优越技术效果在于:通过分层多智能体强化学习算法,结合经验缓冲区和时间预测器,有效提升了多任务移动群体感知的处理效率和能量利用率;移动群体在完成紧急任务后能够利用剩余时间处理监控任务,实现高效的任务调度和轨迹规划,显著提升系统整体响应速度和处理效率,同时最小化能量消耗。
技术关键词
仿真平台
兴趣点
策略
时间片
分配器
多任务
时序
时延
多智能体强化学习
轨迹
计数器
算法
数据
超参数
生成标签
频分多址
任务调度
提升系统
系统为您推荐了相关专利信息
账户风险评估
知识图谱构建
模型训练方法
节点特征
矩阵
动态调节方法
液冷服务器
遗传算法
步进电机
协处理器
动态平衡系统
模糊逻辑控制器
储能系统优化
风光
决策支持单元