摘要
本发明公开了一种基于强化学习的无人车对抗控制方法及装置,该方法包括:构建无人车模拟系统,并为无人车模拟系统中每一无人车创建对应的智能体;基于对若干神经网络的初始化,构建每一智能体的第一无人车对抗控制策略模型;基于对每一智能体对应若干无人车训练任务的奖励设计,构建对应第一无人车对抗控制策略模型的奖励函数;基于无人车模拟系统创建无人车博弈对局,并采集无人车博弈对局的智能体经验数据;基于智能体经验数据对第一无人车对抗控制策略模型进行迭代训练得到第二无人车对抗控制策略模型,并将第二无人车对抗控制策略模型确定为对应的无人车对抗决策模型。本发明能够实现无人车在复杂环境下的高效自主行为。
技术关键词
控制策略模型
网络
模拟系统
无人车转向
集成训练
超参数
决策
速度
数据获取模块
障碍物
风险
运动
实体
训练集
误差
系统为您推荐了相关专利信息
路径分析方法
节点
模型算法
风险
计算机程序产品
带钢表面缺陷
网络结构
通道注意力机制
特征金字塔
数量化方法
故障识别方法
车辆部件
降噪单元
多通道特征
卷积神经网络算法
风光储系统
卷积神经网络模型
蒙特卡洛树
风力发电系统
储能系统