摘要
本发明涉及一种强鲁棒性的室内自动导引车导航避障方法,包括以下步骤,步骤1、自动导引车获取环境扫描数据和位置数据;步骤2、环境扫描数据经过记忆注意力广义网络的多头注意力机制处理,结合位置数据输入到门控循环单元和深度密集残差学习技术集成结构,输出动作指令;步骤3、根据动作指令动作获得奖励值;步骤4、更新导航避障策略,迭代步骤1至步骤4,得到最优低层导航避障策略;步骤5、部署增强型模仿学习、高层导航避障策略和最优低层导航避障策略,在高层导航避障策略指导下进行步骤1至步骤4迭代训练,得到强鲁棒性的室内自动导引车导航避障策略。能够降低计算负担,提高训练效率,增强模型泛化性,确保模型在环境中的稳定性能。
技术关键词
导航避障方法
自动导引车
强鲁棒性
多头注意力机制
门控循环单元
策略
残差学习
导航避障功能
数据
学习算法
重放机制
机载传感器
指令
广义
记忆
网络
标识符
兴趣
负担