摘要
本发明公开了一种基于分层强化学习的水下拓扑控制与信道选择方法。首先在目标水域布设传感器节点并组网,建立分层网络的联合状态空间;其次,上层将拓扑子图构建转化为连续动作控制问题,通过深度确定性策略梯度为网络链路分配连通权重,得到初始拓扑子图;随后,使用最小连通补边机制,在初始拓扑子图的基础上构建可行拓扑子图,实现网络拓扑控制;最后,下层对可行拓扑子图中输出的每条链路,使用Q学习进行信道模式选择。本发明能够实现拓扑控制与信道选择的协同优化,在保证网络连通性的同时提升拓扑控制的效应,并为每条链路选择最优的信道模式。
技术关键词
深度确定性策略梯度
分层强化学习
水下传感器
链路
网络拓扑控制
信道
传感器节点
汇聚节点
双模通信模块
数学
深度优先算法
浮标
模式
参数
能耗
组网
机制
系统为您推荐了相关专利信息
配电网控制方法
分布式电源发电
负荷
配电网数据采集
储能系统充放电
人工智能芯片
数据处理方法
脉冲流
基尔霍夫定律
误码率
充放电功率
交通系统
强化学习算法
深度确定性策略梯度
函数式