基于平均奖励强化学习的机械臂装配方法及系统

正文

推荐专利

申请号：CN202511297431

申请日期：2025-09-11

公开号：CN121018563A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及基于平均奖励强化学习的机械臂装配方法及系统。其中的方法包括：采集装配任务执行过程中的当前状态信息，并通过基于扩散模型的模仿学习策略生成动作分块序列；以所述当前状态信息和所述动作分块序列作为输入，采用基于APO算法的残差强化学习策略，对所述动作分块序列进行实时微调，以生成机械臂实际执行动作；通过闭环控制，实时反馈和调整，以使机械臂完成长视距的复杂装配任务。本发明可提升长视距复杂装配任务的完成率和效率。

技术关键词

强化学习策略机械臂序列计算机装置生成动作噪声闭环控制分块技术矩阵可读存储介质算法装配系统误差轨迹元素参数数据时序网络

系统为您推荐了相关专利信息

一种降低不良率的吹瓶机吹瓶控制方法及控制装置

吹瓶控制方法吹瓶机气压接触点瓶胚

六轴自动平口胀接机器人

液压胀管器支撑框架红外距离传感器机器人液压控制箱

一种基于组合特征编码和DNA结合位点的预测方法

随机森林位点序列变体样本特征编码方法

水稻抗倒伏基因STRONG2的单倍型分子标记在水稻育种中的应用

水稻抗倒伏基因染色体标记植物分子育种技术位点

融合机器视觉的涤纶丝缺陷实时检测分类系统

融合机器视觉检测分类系统涤纶丝光电传感器阵列流分类器

基于平均奖励强化学习的机械臂装配方法及系统

站点导航

APP 下载