摘要
本申请提供一种多智能体资源分配方法,包括:设置训练回合,首先初始化状态信息,按照优化的目标函数设置激励值,基于多个动作信息构建网络环境模型与资源分配模型,获取多个智能体的初始动作信息。其中,网络环境模型被配置为响应于多个动作信息改变智能体所处的网络环境,每个智能体包括一个资源分配模型。基于网络环境模型获取状态信息,将状态信息输入至资源分配模型,以使资源分配模型对动作信息进行优化,对网络环境模型的参数进行调整,得到优化动作信息。基于优化动作信息,得到状态信息。基于状态信息与目标函数进行资源分配。使多个智能体能够自行优化分配资源,提高了资源分配算法的效率。
技术关键词
资源分配方法
信噪比
网络
非授权
策略
频段
非暂态计算机可读存储介质
噪声功率
速率
模式
时序
基站
接入点
资源分配算法
误差
资源分配装置
参数
系统为您推荐了相关专利信息
飞行路径规划
深度递归神经网络
地理围栏技术
长短期记忆网络
路径规划算法
库存预测模型
分布式数据库技术
动态调整机制
库存管理
动态资源分配