摘要
本发明提供一种基于多智能体深度强化学习的计算卸载优化策略,涉及智能算法技术领域。该基于多智能体深度强化学习的计算卸载优化策略,针对MEC多用户计算卸载场景设计的多智能体深度强化学习算法。本发明,利用值分解技术,构建了针对每个任务的任务Q网络结构,并在考虑智能体所有任务关系的基础上生成相应的任务Q值。这些任务Q值可以进一步聚合以得到智能体的Q值,有效缓解了多任务智能体在复杂参数化动作空间中所面临的高时间和空间复杂度问题。此外,在混合网络中利用自注意力机制,针对不同用户的特征动态地分配相应的权重。从而实现更精准的智能体间交互表示,提升了整体决策的灵活性和有效性。
技术关键词
多智能体深度强化学习
混合网络
卸载策略
注意力机制
深度强化学习算法
资源分配策略
决策
智能算法技术
通信资源分配
矩阵
在线
网络结构
复杂度
多任务
多用户
参数
有效性
动态地