摘要
本发明公开了一种基于顺序感知强化学习的边缘用户分配方法及系统,其中方法包括:基于边缘用户和服务器信息构建用于强化学习的特征数据,并基于特征数据进行用户分配,通过策略网络和价值网络进行优化;将策略网络输出的用户分配顺序通过贪心策略转化为详细分配方案,并计算奖励;确定强化学习的核心组成部分,并进行相应评估;优化策略网络和价值网络,初始化网络参数,并通过训练更新提升网络性能,进而实现边缘用户分配。本发明可合理地分配边缘用户的请求和任务,能够有效地提高网络带宽、计算资源和存储资源的利用效率,从而提高整体的网络性能和服务体验。
技术关键词
贪心策略
负载特征
智能采样策略
服务器
长短期记忆网络
网络评估策略
网络带宽波动
编码器
数据
时间序列信息
监督学习方法
多头注意力机制
解码器
参数
随机梯度下降
计算方法
模式
系统为您推荐了相关专利信息
校验算法
车辆诊断设备
验证方法
网络配置信息
网关
血糖预测模型
血糖预测方法
长短期记忆网络
血糖值
元学习算法
车辆座舱
人机交互方法
卡片
车机屏幕
人机交互系统