摘要
本申请提供了一种用于手术机器人具身智能的机械臂多模式综合控制方法及装置,所述方法包括:获取基于逆强化学习处理的第一奖励函数;获取目标位置和障碍物信息;构建基于目标位置的第二奖励函数和基于障碍物信息的第三奖励函数;根据所述第一奖励函数、第二奖励函数、第三奖励函数,通过强化学习对机械臂的运行策略进行训练;选择具有最高累积奖励的运行轨迹,并控制机械臂执行该运行轨迹。本申请中,通过历史操作经验生成第一奖励函数,通过视觉避障生成第二奖励函数和第三奖励函数;通过强化学习的方式,实现基于不同奖励函数的整体运行策略,从而实现了机械臂的基于历史操作经验和视觉避障的综合控制。
技术关键词
综合控制方法
手术机器人
深度Q网络
模式
障碍物
历史轨迹数据
强化学习方法
机械臂
强化学习算法
动态障碍
手术场景
策略
综合控制装置
空间运动轨迹
视觉避障
视频流
存储器
系统为您推荐了相关专利信息
负荷
LOF算法
异常数据
规则匹配技术
特征提取单元
降水预测方法
双线性插值方法
机器学习模型
日期
构建训练集
优化分析方法
历史维修数据
航空器维修
随机森林
需求预测模型
头戴显示器
图像显示模式
显示模组
图像显示方法
人眼