摘要
基于A2‑MADDPG的多频段频谱资源分配方法,属于MAB注意力机制技术领域。技术方案:构建通信系统框架,定义多频段资源分配环境。针对频段特性建模,实现协同工作;采用自适应多尺度卷积和动态注意力机制提取系统状态的多尺度特征;用进化策略优化超参数,实现最优资源分配;建立动态奖励机制,根据动作和环境实时调整权重,兼顾短期与长期目标。有益效果:本发明结合多智能体深度强化学习、自适应多尺度卷积、注意力机制和进化策略构建多频段协同资源分配方案,能够减少频带间损耗以提高频谱利用率;融合自适应所尺度卷积和动态注意力机制,提升算法的自适应能力,使得系统在不同网络环境和需求变化下均能保持较高的性能,显著减少干扰并提高频谱利用率。
技术关键词
频谱资源分配方法
注意力机制
进化策略
多智能体深度强化学习
多频段
建立通信系统
多尺度卷积核
接入点
动态
资源分配策略
神经网络参数
信道状态信息
多尺度特征