摘要
一种用于采用顺应性控制器的高精度装配任务的机器人技能学习的方法和系统。强化学习(RL)控制器在离线模式下使用人类演示数据进行预训练,其中执行演示的若干次重复,同时收集每次重复的状态和动作数据。演示数据用于在RL控制器与顺应性控制器/机器人系统没有交互的情况下预训练RL控制器中的神经网络。在预训练之后,RL控制器被移动到在线生产,在该在线生产中,RL控制器在自学习模式下耦合到顺应性控制器/机器人系统。在自学习期间,基于神经网络的RL控制器使用动作、状态和奖励数据来继续学习状态和有效动作之间的相关性。在自学习期间根据需要提供共同训练,其中人类操作者超控RL控制器动作以确保成功的装配操作,这提高了RL控制器的学习性能。
技术关键词
学习控制器
强化学习技术
机器人控制器
数据
人类
策略
机器人系统
模块
模式
离线
频率
学习系统
回路
参数
度量
定义
关节
速度
系统为您推荐了相关专利信息
铣削机器人
模态固有频率
冗余度
阻尼系统
铣削主轴
网络安全态势预测方法
网络安全数据
蜜罐
网络安全态势感知
狼群算法
电器盒组件
组装设备
打螺钉装置
定位单元
机器人
证件
预警模型
人脸身份
电子证照数据
电子身份证