摘要
本发明涉及空间机器人技术领域,特别是指一种基于强化学习的空间桁架多机器人协同装配方法及装置。所述方法包括:确定待装配的桁架单元;获取多个空间机械臂的状态信息,将状态信息输入到最优空间机械臂的策略模型,得到多个空间机械臂的运动决策控制指令;根据运动决策控制指令,控制多个空间机械臂对桁架单元进行装配,完成多机器人协同的桁架装配任务。本发明根据空间机械臂子系统的实时状态选择最优操作决策,并向多个机械臂发送运动控制指令进行定位、调整位姿,实现最大操作奖励值的获取,从而完成多个机械臂协同操作,有效解决空间桁架的机器人自主协同装配问题。
技术关键词
桁架单元
多机器人协同
策略
决策
计算机可读取存储介质
仿真环境
训练神经网络
装配装置
计算机可读指令
空间机器人技术
运动
装配设备
空间机械臂
输入模块
样本
序列
系统为您推荐了相关专利信息
结构优化设计方法
结构设计方案
引入遗传算法
样本
机制
LSTM神经网络模型
预测客流量
数据处理方法
矩阵
客流特征
楼宇设备
设备状态参数
设备检测终端
控制策略
多模态
销售数据管理
电子元件
动态知识图谱
时效性
强化学习算法