摘要
本发明涉及机械臂控制的技术领域,更具体地,涉及一种机械臂控制方法及系统,包括基于策略网络确定目标下棋位置,基于误差补偿模型调整目标下棋位置,得到经验下棋位置,根据经验下棋位置控制机械臂放置棋子;并在整局游戏结束后,根据游戏结果和误差补偿模型更新策略网络。本发明通过在每次对局后根据游戏结果和误差数据迭代训练,对策略网络进行反馈调整,整合游戏结果、误差数据和棋盘状态数据生成目标下棋位置,增强系统的端到端性能,在物理误差不可抗的基础上整体提高下棋胜率。
技术关键词
机械臂控制方法
误差补偿模型
策略
棋盘
机械臂控制系统
偏差
游戏
棋子
高层次
输入神经网络模型
模块
序列
数据
损失函数优化
强化学习算法
图像处理技术
系统为您推荐了相关专利信息
压电致动器阵列
作业系统
风电机组
惯性导航姿态
液压伺服机构
无人机反制设备
无人机反制方法
态势评估算法
深度学习网络
模型训练方法
设备性能评估
决策方法
证据推理方法
指标
置信规则库