摘要
本发明涉及机器人控制技术领域,具体涉及一种基于强化学习的神经外科手术机器人避障方法,包括:基于三维环境图像确定目标空间,确定神经内镜的状态空间信息,确定神经内镜的动作空间信息;确定手术机器人运动动作的奖励模型和惩罚模型;采用深度确定性策略梯度算法进行训练,得到避障控制模型;运行神经外科手术机器人,由所述位置传感器和力传感器获取实时状态,输入所述避障控制模型,得到控制动作;由所述控制动作控制手术机器人,完成手术机器人的运动避障,本发明能够提高神经外科手术机器人的避障精度、实时性和适应性。
技术关键词
神经外科手术
机器人避障系统
接触结构
深度确定性策略梯度
机器人避障方法
断层扫描图像
手术机器人机械臂
运动
机器人控制技术
终点
表达式
医学成像设备
三维模型
机器人关节
算法
力传感器
系统为您推荐了相关专利信息
优化控制模型
智慧物流车
深度确定性策略梯度
生成方法
仿真环境
机器人避障方法
障碍物
运动
机器人避障装置
轨迹
海上风电机组
智能升压站
仿真环境
控制策略
网络
客户端
联邦学习方法
深度确定性策略梯度
分层
无人机电量
下肢康复训练机器人
丝杠滑台结构
伺服驱动轮
激光测距传感器
康复机器人