基于多智能体强化学习算法的信道争用优化方法及系统

正文

推荐专利

申请号：CN202510454852

申请日期：2025-04-11

公开号：CN120201580A

公开日期：2025-06-24

类型：发明专利

摘要

本发明涉及一种基于多智能体强化学习算法的信道争用优化方法。首先，基于多智能体Actor‑Critic的强化学习算法，根据网状无线网络的拓扑结构和动态特性，建模一个五维度的马尔可夫决策过程；为每个actor构建一个神经网络；通过构建无线网状网络端到端延迟模型和信道效率模型，并设置无线网状网络奖励机制及其平衡方法。然后，基于以上步骤构建了无线网状网络信道争用目标函数。通过设计强化学习方法，并引入对抗训练，获得优化的无线网状网络信道争用目标函数。最后对所得目标函数的收敛性和稳定性进行验证。本方法解决现有技术中无线网状网络优化方法中容易陷入局部最优和面临高维动作空间时优化效率低下的问题。

技术关键词

信道争用多智能体强化学习无线网状网络神经网络参数网状无线网络强化学习算法强化学习方法接入点轨迹平衡方法对抗性奖励计算方法无线网络拓扑定义系统功率机制模块

系统为您推荐了相关专利信息

一种基于大模型与多智能体的能耗监测与优化方法、系统

高维特征向量多模态传感器混合神经网络模型能耗多模态数据融合

基于软门控融合机制和自适应频域感知的弱光图像增强方法

弱光图像增强方法频域特征设计特征模块二维离散小波变换

一种生成式动态生产资源排产均衡方法及系统

线性规划算法深度神经网络模型均衡方法排产计划产能

一种基于多智能体强化学习的供应链自动化合约代理方法

多智能体强化学习代表利润决策网络优化

一种电阻率测井约束的储层物性参数叠前地震反演方法

叠前地震反演方法储层物性参数电阻率测井饱和度剪切模量

基于多智能体强化学习算法的信道争用优化方法及系统

站点导航

APP 下载