SDWN中基于多智能体图强化学习的多对多通信路由方法

AITNT
正文
推荐专利
SDWN中基于多智能体图强化学习的多对多通信路由方法
申请号:CN202510213322
申请日期:2025-02-25
公开号:CN119966873B
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开一种SDWN中基于多智能体图强化学习的多对多通信路由方法,首先设计了一种基于Q‑learning强化学习算法,优化部署智能体的网络节点数量,从而降低现有方法对所有网络节点部署智能体带来的计算和部署成本;然后在AC框架下的设计了一种集中式训练分布式执行的多智能体深度强化学习算法,为了减少模型训练的存储空间开销分别使用图卷积神经网络和图神经网络重新设计Actor和Critic的网络结构,解决了现有方法中卷积神经网络对拓扑结构数据适应能力比较弱的问题;最后提出动作空间局部观测方法来避免无效动作的生成,从而降低模型训练的时间开销并加快收敛速度,从而降低模型训练的时间开销并加快收敛速度。
技术关键词
智能网络节点 网络节点集合 网络节点数量 编码 深度强化学习算法 拓扑结构数据 能耗 网络拓扑信息 队列 智能体交互 决策 邻居 观测方法 特征选择 网络结构 样本
系统为您推荐了相关专利信息
1
图像质量评价模型训练和评价方法、系统、设备及介质
视觉特征编码 模型训练方法 样本 评价方法 模版
2
基于扩散模型和参数化水平集的吸能超材料逆向设计方法
逆向设计方法 拓扑优化方法 神经网络架构 水平集方法 水平集函数
3
一种基于机器视觉与机器人协同的主轴承盖打磨系统及控制方法
打磨控制方法 运动状态信息 边缘轮廓 轴承盖 路径规划算法
4
一种磁吸式轮腿切换绳驱四足机器人及其控制方法
腿部结构 定滑轮 复合铰链 吊臂 关节编码器
5
一种基于时空注意力的轨迹预测方法、装置、设备及介质
时空注意力机制 轨迹预测方法 轨迹预测模型 多头注意力机制 门控循环单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号