摘要
本发明提供的一种基于多智能体强化学习的TSN‑5G列车通信网络异步调度方法。该方法包括:基于列车TSN‑5G异构场景的拓扑结构利用图神经网络构建马尔可夫模型,定义马尔可夫模型的状态空间、动作空间和奖励函数,将TSN‑5G异构网络中的待处理的数据流信息输入到列车TSN‑5G多智能体强化学习异步调度算法中,列车TSN‑5G多智能体强化学习异步调度算法将每个基站与交换机作为独立智能体,通过迭代运算对马尔可夫模型中的状态空间、动作空间进行更新,输出待处理的数据流的调度方案。本发明提出了一种综合方案,结合TSN‑5G中有线与无线信道的利用率与端到端抖动性能,达到优化数据传输的目的,以实现对整车网络的端到端时延和抖动进行最优控制。
技术关键词
马尔可夫模型
异步调度方法
5G异构网络
多智能体强化学习
列车通信网络
调度算法
独立智能
交换机
参数
数据帧传输
代表
生成动作
服务器
定义
样本
双网络结构
系统为您推荐了相关专利信息
标记
位点
主成分分析降维
基因分型数据
群体遗传结构
门控循环单元
服务迁移方法
多智能体强化学习
星地协同
基站
形变监测方法
时间序列模型
监测点
大地水准面模型
北斗导航定位系统
无人机集群对抗
导弹
基线
无人机集群协同
多智能体强化学习
策略更新
滑动窗口
多智能体强化学习技术
存储库
多智能体系统