摘要
本发明提供一种基于多智能体深度强化学习的双阶段协同优化方法,在大模型协同微调阶段,车辆将采集的环境信息传输至所属的无人机进行大模型微调;车辆发出的请求根据雷达感知信息估计率的优先级进行排队处理;在大模型协同推理阶段,无人机将地面车辆用户根据不同的服务请求进行分类处理;无人机与其所属类别的车辆进行共享推理任务;并且在两个阶段分别通过MADDPG算法调整自身的发射功率来优化车辆通信速率、以及通过MAPPO算法优化无人机之间的位移和资源分配,并最大化下行链路的通信速率。本发明通过多智能体协作,优化大规模模型的微调与推理过程,提升车联网系统中通信和感知效率,同时提高车辆用户的AIGC服务满意度。
技术关键词
多智能体深度强化学习
协同优化方法
阶段
网络
建立通信
速率
控制无人机悬停
预测雷达回波
资源分配
地面车辆
图像
策略更新
多智能体协作
设计约束条件
参数
算法
链路
系统为您推荐了相关专利信息
航迹规划方法
多无人机协同通信
地图模型
能效
协同航迹
故障根源分析
故障诊断方法
神经网络算法
拓扑结构信息
故障案例库
唤醒词检测方法
自定义语音
解码网络
拼音
维特比算法