面向动态频谱共享的异构多智能体熵正则化资源分配方法

正文

推荐专利

申请号：CN202510781710

申请日期：2025-06-12

公开号：CN120343728B

公开日期：2025-08-12

类型：发明专利

摘要

本发明公开了一种面向动态频谱共享的异构多智能体熵正则化资源分配方法，属于无线网络通信技术领域，包括加载基础训练器，管理后续强化学习的过程；构建仿真环境，建立数学模型，初始化参数解析，构建训练环境与评估环境，并创建智能体；用随机策略生成初始经验数据并填充经验回放缓冲区，在达到预设的预热步数后返回最终状态，正式训练将从经验回放缓冲区采样数据更新网络；开启正式训练流程，智能体与环境交互，存储经验数据到缓冲区；通过策略梯度优化策略网络，用TD误差优化评价网络。本发明采用上述方法，解决了传统DRL方法在频谱分配中因策略收敛到次优而导致的性能瓶颈问题，通过随机策略优化实现了接近全局最优的资源配置效率。

技术关键词

动态频谱共享资源分配方法强化学习策略仿真环境路径损耗模型 Rician信道认知无线通信系统下无线通信系统频段信噪比无线网络通信技术检测信道状态时分多址协议训练器异构多智能体

面向动态频谱共享的异构多智能体熵正则化资源分配方法

站点导航

APP 下载