摘要
本发明涉及一种区块链辅助基于PPO的自动驾驶决策方法,属于移动通信技术领域。智能网联汽车CAV自动驾驶决策模型需要海量的训练数据,然而共享CAV数据将带来隐私泄露和数据安全问题。为了解决上述问题,本发明首先设计了结合有向无环图DAG区块链和联邦学习技术的双层车联网络架构,并基于该架构设计了基于深度确定性策略梯度DDPG算法的异步联邦学习方案;其次,在本地训练阶段,提出基于条件模仿学习CIL的策略网络预训练算法;最后,提出一种基于近端策略优化PPO的自动驾驶决策模型,并在复杂道路场景下设计个性化奖励函数。该方案在提升CAV自动驾驶决策性能的同时,实现低负载CAV协同训练,保证CAV数据隐私安全。
技术关键词
自动驾驶决策方法
区块链辅助
驾驶决策模型
智能网联汽车
策略
联邦学习技术
联邦学习模型
有向无环图
移动通信技术
训练算法
仿真场景
网络
模型更新
数据安全
多任务
鲁棒性