摘要
本发明提供一种基于强化学习的无人机光通信链路跟瞄方法,涉及无人机光通信技术领域。该方法具体包括:获取无人机光通信链路的特征参数并构建无人机光通信链路信道模型;定义用于调整无人机吊舱姿态的智能体,并基于无人机光通信链路信道模型建立智能体的交互环境;基于智能体的交互环境,分别定义智能体的状态空间、动作空间和奖励函数;根据给定的飞行任务需求选择深度确定性策略梯度DDPG算法或近端策略优化PPO算法训练智能体,生成无人机吊舱姿态的最佳调整策略。本发明基于深度确定性策略梯度算法和近端策略优化算法,有效降低了无人机光通信在高动态环境下的中断率和误码率。
技术关键词
光通信
网络
链路
训练智能体
无人机吊舱
生成无人机
策略
参数
坐标
无人机姿态
信道
构建无人机
算法
捕获器
对准误差
模拟模型
系统为您推荐了相关专利信息
爬虫框架
抓取频率
数据库存储器
分布式爬虫技术
过滤模块
拓扑网络
生态
分析系统
时间段
一维卷积神经网络
多处理器系统
变量
资源调度方法
因子
梯度下降算法
出行需求
历史出行特征
回归预测模型
规划
生成用户