摘要
本发明提供了一种基于深度强化学习的无人机辅助通感算一体化方法及系统,包括S1,设计系统架构,包括部署无人机以及地面设备;S2,设计无人机的服务周期阶段划分以及帧结构;S3,基于无人机的服务周期的阶段划分以及帧结构,计算雷达估计信息速率、感知能耗、通信能耗、计算能耗以及无人机总能耗;S4,构建优化模型:构建联合优化目标,最小化各能耗,最大化服务成功率;S5,基于优化模型,构建强化学习模型;S6,优化强化学习模型:构建Actor网络和Critic网络并优化其中的算法策略,得到策略模型;S7,训练策略模型,获得最优的Actor网络;S8,根据最优的Actor网络,控制无人机的决策。
技术关键词
深度强化学习
一体化方法
强化学习模型
能耗
物联网终端
地面设备
雷达
网络
设计系统
通信天线阵列
架构设计模型
阶段
决策
控制无人机
策略更新
服务无人机
干扰消除技术
系统为您推荐了相关专利信息
深度强化学习
LSTM神经网络
服务器
在线深度学习
滑动窗口采样
波分复用传输系统
链路功率控制方法
波长选择开关
波分复用系统
信噪比
伸缩位移传感器
掘进机
能耗
曲线斜率
压力传感器
音频均衡方法
耳机均衡器
深度强化学习
强化学习环境
参数