摘要
本发明属于无线通信领域,提出了一种基于对比与重置聚合元强化学习的动态频谱控制方法,用于多任务无线通信中的控制策略。本发明首先利用对比学习预训练表示学习模型,通过无负样本的对比学习架构和双网络设计,有效提升模型的泛化能力和学习效率。此外,通过引入重置‑聚合机制,本发明支持周期性地重置网络参数,与历史模型进行聚合,从而保持模型在多任务环境中的稳定性和适应性。本发明能显著提升无线通信系统在动态环境中的性能,实现更快的收敛速度、更好的适应性和更强的泛化能力,特别适合应用于频谱资源的实时变化和用户需求的快速动态调整。
技术关键词
频谱控制方法
强化学习算法
代表
投影器
样本
无线通信系统
动态
嵌入位置信息
多任务
轨迹
网络架构
多头注意力机制
在线
参数
前馈神经网络
数据
离线
控制通信
系统为您推荐了相关专利信息
数据记录设备
模型构建装置
电阻值
四线测量法
搅拌器