摘要
本发明的一种未知动态环境中人机混合自主导航系统,包括环境感知模块利用激光雷达、摄像头和惯性测量单元这些传感器获取环境信息,并进行数据预处理;局部目标点选取模块根据环境感知模块提供的实时信息,在环境中选取符合要求的局部目标点集;决策规划模块,基于深度强化学习算法与人工经验混合训练生成最优路径和导航策略;学习优化模块通过在线学习与迁移学习技术提升算法的泛化能力,并结合人机交互模块实现人类经验的有效引入和策略调整。人机交互模块可与局部目标点选取模块协同工作,以根据外部输入动态调整目标点选取,优化路径规划。本发明能够在未见环境中保持较高的决策稳定性,并减少训练成本,更加适用于真实世界的自主导航应用。
技术关键词
自主导航系统
策略
人机交互模块
障碍物
迁移学习技术
激光雷达数据
传感器获取环境
动态
深度强化学习算法
卡尔曼滤波
激光传感器
粒子滤波融合方法
决策
人类
网络
引导机器人