一种非专家数据辅助的元强化学习跳频干扰资源分配方法

AITNT
正文
推荐专利
一种非专家数据辅助的元强化学习跳频干扰资源分配方法
申请号:CN202510026442
申请日期:2025-01-08
公开号:CN119865208B
公开日期:2025-09-26
类型:发明专利
摘要
本公开实施例是关于一种非专家数据辅助的元强化学习跳频干扰资源分配方法,包括:根据通信对抗场景构建跳频干扰资源分配问题;将跳频干扰资源分配问题建模为马尔可夫决策过程;随机初始化元策略得到初始策略网络;基于MAML算法对初始策略网络进行元训练,其中,元训练包括:在特定任务适应阶段,基于非专家数据,利用强化学习损失函数和行为克隆损失函数对初始策略网络进行优化训练,得到特定任务策略,并计算各干扰任务的强化学习损失;在元优化阶段,最小化所有干扰任务的强化学习损失,并得到优化后的分配策略;根据新的干扰任务对优化后的分配策略进行微调。本公开结合强化学习和行为克隆从非专家数据中提取有用信息,实现高效的策略探索。
技术关键词
跳频干扰 资源分配方法 策略 数据 网络 阶段 参数 决策 干扰加噪声 算法 场景 信道 功率 频率 符号 信号 轨迹 因子 节点
系统为您推荐了相关专利信息
1
一种基于人工智能的甲状腺扫查质控系统
质控系统 超声扫查设备 对比度 多尺度 深度学习模型
2
一种基于改进YOLOv8的血细胞检测方法
多尺度特征融合 图像 白细胞 椒盐噪声 抑制算法
3
一种基于大语言模型的策略生成与评估方法、介质及设备
大语言模型 策略 文本 生成方式 抽象语法树
4
基于血浆免疫球蛋白G的N-糖基化谱型的生物年龄评价方法
模型构建方法 指数 生物年龄评价方法 高效液相色谱 免疫球蛋白
5
基于混淆策略的跨平台网络用户对齐干扰方法和装置
干扰方法 网络用户 策略 节点 保护用户隐私
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号