摘要
本发明提供一种基于深度强化学习的无人机辅助车联网资源分配方法,包括:通过建立多维参数联合优化框架,实现了车辆‑无人机关联、频谱资源分配和无人机运动轨迹的协同优化,构建了系统能量效率最大化模型。本方法创新性地融合距离聚类算法与深度强化学习,通过特征空间降维显著提升了训练过程的收敛性和稳定性。进一步地,采用“离线预训练‑在线自适应决策”相结合的混合执行机制,有效解决了动态环境下的实时资源优化问题。本发明方法在系统能量效率和决策实时性与稳定性等关键性能指标上均优于传统方案,为无人机辅助车联网系统提供了高效的资源管理新范式。
技术关键词
深度强化学习
辅助车
资源分配方法
无人机轨迹规划
策略优化方法
多无人机
联网系统
车辆
系统能量效率
服务质量需求
聚类算法
训练算法
决策
无人机运动轨迹
载波分配
系统为您推荐了相关专利信息
多智能体深度强化学习
激励方法
平台
阶段
任务分配算法
深度强化学习方法
多车型
长短期记忆网络
编解码处理器
车辆路径优化技术
需求响应策略
深度确定性策略梯度
激励方法
负荷
交互决策方法
资源分配方法
动态规划方法
资源调度优化
动态规划算法
贪心策略