摘要
本发明提供基于强化学习的机器人自主任务规划与执行控制方法,属于机器人控制领域。该方法包括:根据机器人搭载的传感器模块,采集多源数据,并对所述多源数据预处理,生成实体状态原始数据集;利用数字孪生模型,进行动态映射与损耗参数校准,生成虚拟实体状态匹配数据集;利用预设的强化学习策略预演机制,进行策略训练,生成候选策略集;利用预设的策略筛选机制,确定最优执行策略,并驱动机器人执行所述最优执行策略,以实现机器人自主任务规划与执行。本发明可降低机器人机械损耗,减少因过度磨损导致的停机维护次数,提升生产效率,虚拟预演策略的实体执行准确率提升,减少策略重新训练的样本需求量,缩短新场景下的策略适配周期。
技术关键词
执行控制方法
数字孪生模型
参数校准
强化学习策略
实体
损耗
强化学习模型
规划
数据
仿真环境
修正机构
传感器模块
机制
机械
强化学习算法
机器人控制
剔除噪声
系统为您推荐了相关专利信息
智能运维方法
意图识别模型
混合异构网络
多模态
设备运行状态
业务关联方法
自然资源
图谱
土地利用现状
建立关系模型
监督学习算法
层次化语义
监督学习模型
真菌
实体间关系