摘要
本发明属于自主决策技术领域,涉及一种有人/无人协同自主决策方法及应用,包括步骤S101:在模拟仿真环境下,训练单体决策模型,S102:决策模型构建无人智能体;S103:设计有人决策模型;S104:决策模型构建有人智能体;S105:将智能体与智能体联合训练,得到有人/无人协同决策模型model1;S201:在半物理仿真环境下,基于模型model1构建无人智能体;S202:有人驾驶物理模拟器;S203:将无人智能体与步骤物理模拟器联合训练,强化model1,得到决策模型model2;S301:在真实环境下,基于model2构建无人系统;S302:有人驾驶实装装备,S303:将步骤S301无人系统与步骤S302有人平台协同训练,强化model2,得到最终决策模型model3。
技术关键词
自主决策方法
仿真环境
强化学习方法
模拟器
自主决策技术
无人艇系统
无人车系统
ID3算法
生成训练数据
构建决策树
航空
无人机系统
物理
装备
单体
策略
高层次