一种基于深度强化学习的无人机通信系统策略优化方法

AITNT
正文
推荐专利
一种基于深度强化学习的无人机通信系统策略优化方法
申请号:CN202411681837
申请日期:2024-11-21
公开号:CN119652389A
公开日期:2025-03-18
类型:发明专利
摘要
一种基于深度强化学习的无人机通信系统策略优化方法,建立无人机通信系统模型,包括一个无人机、RIS以及多个地面接收用户,在给出特定的信道状态信息(CSI)情况下,利用深度强化学习(DRL)技术,通过改进的TD3算法improvement‑TD3对最大化速率C进行优化,求得最优的波束成形矩阵和相移矩阵。本发明在现有的TD3算法中引入了熵正则化,以增强探索性,促使智能体更多地探索环境,平衡探索与利用之间的关系,最终获得最优的发射波束成形矩阵和RIS相移,避免陷入局部最优解,提高学习的鲁棒性和泛化能力。
技术关键词
无人机通信系统 策略优化方法 深度强化学习 波束成形矩阵 确定性策略梯度 网络 接收端 梯度下降算法 概率密度函数 信道状态信息 检验系统 速率 反射单元 噪声 反射面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号