摘要
本发明公开一种异构网络多频段协同方法、装置及介质。该方法包括:将用户测量信息输入多智能体多频段协同算法的多个智能体,执行实时强化学习单元,输出Q值给经验重放单元,同时触发计时器1;如果计时器1没有停止,经验重放单元持续进行迭代;如果计时器1停止,则将经验重放单元的结果输出目标强化学习单元,对Q值进行训练,同时触发计时器2;如果计时器2停止,目标强化学习单元将得到的Q值输出给实时强化学习单元;如果计时器2没有停止,目标强化学习单元持续进行迭代;多智能体多频谱段协同算法的多个智能体输出多个Q值,每个Q值对应一个或若干个用户的频段资源分配结果。本发明为各类型业务、通信终端和通信网络提供技术支撑。
技术关键词
计时器
资源分配
神经网络单元
协同方法
奖励系统
协同算法
MLP神经网络
定义
异构
多用户
控制单元
数据获取模块
通信终端
多频段
通信网络
记忆
可读存储介质
系统为您推荐了相关专利信息
资源分配方法
车辆
数字孪生体
节点
深度强化学习算法
语言模型优化方法
云端服务器
边缘计算环境
瑞利衰落信道
动态资源分配
多智能体协同
搜索算法
资源分配方法
耦合机制
生成资源
计算机保密核查装置
计算机保密系统
数据采集单元
数据处理单元
网络通信数据
资源动态调度方法
应急资源调度
水库大坝
情景
洪水演进模拟