摘要
本申请提供一种机场环境通信并发控制方法、装置及电子设备,用于改善机场环境通信并发控制的资源利用效率较低的问题。该方法包括:通过强化学习模型中的策略神经网络基于样本数据选择并执行机场设备的目标动作,获得机场设备在当前通信周期内采集的设备数据;基于样本数据、设备数据、目标动作和目标动作对应的奖励值优化强化学习模型中的目标神经网络,目标神经网络的网络架构与策略神经网络的网络架构相同;将目标神经网络的模型参数赋值给策略神经网络,获得策略网络模型;使用策略网络模型对机场设备的通信策略进行控制,通信策略为从动作空间中选择出需要执行的目标动作,动作空间包括多个动作。
技术关键词
机场设备
强化学习模型
策略网络模型
并发控制方法
数据
样本
网络架构
记忆体
机器可读指令
通信策略控制
机器学习模型
周期
电子设备
计算机程序产品
处理器
模块
资源
存储器
系统为您推荐了相关专利信息
模型训练方法
编码模块
动作预测方法
图像特征向量
机器人
分布式安全监控方法
传感器节点
关键点
在线
协方差矩阵
训练样本集
语言模型训练方法
分词
大语言模型
文本