摘要
本发明涉及一种面向差异化任务的机器人深度强化学习运动规划方法,通过多角度视觉采样系统中快速重建神经网络(FRNN)将机器人的工作环境实时地重建和分析。搭载了动态熵执行者‑评论家(DEAC)和教学‑指导机制(TG)的机器人在虚拟的场景中训练轨迹规划以完成运动规划任务,当场景出现变化时,提出的PP和IKM会被激活,帮助机器人快速地适应新环境,同时满足轨迹和能量消耗的最优目标。解决了目前难以获取三维空间场景信息、使机器人具备自主学习运动规划和快速适应环境中未知的变化的能力的问题,可使机器人自主地学习运动规划策略,当环境发生改变时,规划策略可以实时地调整,而无需人工干预,提高了机器人执行任务的鲁棒性和工作效率。
技术关键词
运动规划方法
深度强化学习
视觉采样系统
能量消耗
机器人运动规划
训练机器人
节点
机器人关节
障碍物
轨迹
三维重建算法
多角度
三角形
教师
人工神经网络
数据
场景
系统为您推荐了相关专利信息
物联网设备
深度强化学习
卸载系统
服务器
分配信息
三维环境模型
无人机追踪技术
视觉跟踪算法
飞行控制方法
机载传感器
AP设备
超表面
无线网络覆盖区域
中心服务器
调控算法