摘要
一种基于多模态信息融合的移动机器人避障策略优化方法,对移动机器人进行部分可观马尔科夫决策过程建模;设计新的多模态融合方法,帮助移动机器人在避障过程中获得更优秀的感知能力;针对多模态感知下部署SAC强化学习算法,实现移动机器人的初步避障;针对避障策略函数利用斯坦因变分梯度因子进行避障策略优化;训练修改好的SAC算法模型,并将最终训练好的模型部署到移动机器人中,使其能够更好的完成路径规划。本发明引入了多模态信息融合方法于强化学习算法中,使用斯坦因变分梯度优化策略,提升策略更新效率与训练过程的稳定性,缓解复杂或动态空间下的梯度退化问题,最终完成有效提升路径规划的性能。
技术关键词
移动机器人避障
多模态信息融合
策略优化方法
SAC算法
多模态融合方法
网络
障碍物
驱动移动机器人
融合特征
路径规划决策
深度强化学习算法
粒子
信息融合方法
系统为您推荐了相关专利信息
SVM分类
RANSAC算法
激光雷达
货物尺寸
货物宽度
静态特征
RANSAC算法
多尺度Retinex算法
导航方法
构建环境地图
弱纹理图像配准方法
融合光流法
特征点
局部特征描述符
RANSAC算法
视觉SLAM方法
RANSAC算法
动态物体
实例分割网络
光照