摘要
本发明公开了基于深度强化学习的多模态机器人导航方法及系统,构建深度强化学习模型,设计奖励函数,以计算机器人在每次执行动作后的奖励值用于模型训练;将每一时刻采集的图像、点云数据和子目标点位置作为状态数据,输入到深度强化学习模型中,深度强化学习模型输出每一时刻的线速度、角速度和状态值;根据机器人与环境的交互数据,采用近端策略优化算法对深度强化学习模型进行优化,最终得到一个最优策略模型;最优策略模型利用多模态数据和子目标点位置信息,输出最优的线速度和角速度组合,用于控制机器人执行导航任务。
技术关键词
深度强化学习模型
机器人导航方法
计算机可读指令
障碍物
数据
多模态
策略
机器人导航系统
特征提取模块
图像
输入端
非暂时性
点云
分支
计算机程序产品
激光雷达
处理器
算法
系统为您推荐了相关专利信息
疲劳检测方法
脑电特征
深度卷积神经网络
采集脑电信号
脑电信号采集器
工程进度数据
工程进度管理系统
识别关键路径
计划
工程施工管理技术