摘要
本发明公开了一种基于强化学习的分布式混合专家网络分配方法,包括以下步骤:步骤S1.构建分布式混合专家网络分配系统的模型:步骤S2.对于每个专家进行无线丢包建模与缓冲区动态建模;步骤S3.使用基于强化学习的门控机制,进行任务分配和专家选择的过程建模和优化。本发明能够根据信道条件、专家的缓冲区状态及任务需求动态调整专家选择,通过引入信道状态信息(如信噪比、衰落等),使得门控网络在不同信道条件下选择最合适的专家,从而提高系统的计算效率和性能。
技术关键词
混合专家网络
栅格
无线网络传输
DQN算法
分配系统
最小化系统
信道状态信息
机制
模式
动态
状态更新
终端设备
决策
信噪比
样本
定义
周期
图像