摘要
本发明提出的基于多阶段课程学习的类人机器人跌倒恢复控制方法,通过将机器人跌倒爬起动作分解为多个关键帧,并逐帧分阶段学习,同时引入混合内部模型和强化学习框架,混合内部模型实时获取机器人当前观测值,通过估计速度,获取特征信息,增强策略的鲁棒性,减小了仿真与真实的差距,结合混合内部优化与近端策略优化的强化学期框架,通过与仿真环境交互,使机器人学习快速稳定地从一个关键帧过渡到下一个关键帧,实现复杂人形运动行为的学习,本申请优化了人机交互安全性能,使机器人能够在医疗护理、家庭服务等需要密切人机协作的场景中可靠运行为构建更智能、更安全的下一代服务机器人系统奠定了技术基础。
技术关键词
恢复控制方法
类人机器人
多阶段
强化学习框架
关键帧
服务机器人系统
策略
仿真环境
分阶段
助力机器人
机器人手部
镜像
引导机器人
人机协作
网络
机器人本体
生成动作
评价器
编码器
系统为您推荐了相关专利信息
视觉SLAM算法
关键帧
三维建模方法
稠密点云
城市地下空间
多阶段
数据
开源项目
恶意代码分析
深度优先遍历
驾驶仿真场景
生成方法
关键帧
多模态
智能驾驶感知