摘要
基于多智能体深度强化学习的多模式路由优化方法,属于边缘计算与网络路由领域,包括:构建多模式路由架构,并设计多模式路由节点交互机制;构建多智能体的状态空间、动作空间、空间状态转移概率和奖励函数;设计双层语义自注意力机制;构建并训练增强型多智能体深度强化学习模型;设计智能体运行协议动态切换的触发条件;设计模型性能评估函数与超参数调优策略。本发明通过设计具有可切换工作模式的路由节点,使其能根据网络状态动态选择路由协议;利用集中式训练与分布式执行框架,结合本地和全局价值网络实现多智能体的协同优化;引入双层语义自注意力机制提升对异构网络状态的解析能力,保证路由可靠性,提高网络吞吐量、降低传输时延。
技术关键词
多智能体深度强化学习
注意力机制
多模式
交互机制
网络节点
可切换工作模式
确定性策略梯度
双层结构
语义
协议
网络吞吐量
贪婪策略
批量数据
动作特征
移动节点
时延
系统为您推荐了相关专利信息
语义向量
知识融合方法
注意力机制
词向量模型
冗余
视觉深度学习
细胞分割方法
多通道特征
分支
特征提取网络
时间卷积网络
能源负荷预测系统
综合能源系统优化
时序特征
注意力机制