摘要
本发明公开了一种基于深度强化学习的多车协同感知任务调度方法,属于智能交通系统与车联网协同感知技术领域,包括如下步骤:在每个调度时间片内,由成员车辆与边缘服务器向头部车辆上报当前感知信息;头部车辆将自身任务队列长度作为系统状态输入,通过PPO算法生成调度动作;头部车辆将感知任务下发至成员车辆与边缘服务器,并收集各节点在执行任务后的反馈;根据各节点对感知任务的处理时间与响应波动,计算系统奖励函数;系统基于多个调度周期的状态‑动作‑奖励轨迹,结合优势估计优化策略网络。本发明以头部车辆感知任务为中心,结合状态压缩、任务分发动作离散建模与长期稳定性奖励函数设计,实现大范围低延迟协同感知的智能调度优化。
技术关键词
任务调度方法
深度强化学习
车辆
协同感知技术
策略
网络
智能交通系统
服务器
周期
队列
通信链路
轨迹
因子
低延迟
时延
节点数
算法
广义
系统为您推荐了相关专利信息
短期负荷预测方法
联合注意力机制
灰色关联度
多模态注意力
负荷传感器
动态权重优化
多模态特征融合
语义特征
决策算法
条目
故障恢复策略
配电网故障自愈
电压越限风险
样本
虚拟同步机控制方法
数据安全加密方法
加密策略
索引机制
可读存储介质
节点