基于平均奖励强化学习的机械臂装配方法及系统

AITNT
正文
推荐专利
基于平均奖励强化学习的机械臂装配方法及系统
申请号:CN202511297431
申请日期:2025-09-11
公开号:CN121018563A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及基于平均奖励强化学习的机械臂装配方法及系统。其中的方法包括:采集装配任务执行过程中的当前状态信息,并通过基于扩散模型的模仿学习策略生成动作分块序列;以所述当前状态信息和所述动作分块序列作为输入,采用基于APO算法的残差强化学习策略,对所述动作分块序列进行实时微调,以生成机械臂实际执行动作;通过闭环控制,实时反馈和调整,以使机械臂完成长视距的复杂装配任务。本发明可提升长视距复杂装配任务的完成率和效率。
技术关键词
强化学习策略 机械臂 序列 计算机装置 生成动作 噪声 闭环控制 分块技术 矩阵 可读存储介质 算法 装配系统 误差 轨迹 元素 参数 数据 时序 网络
系统为您推荐了相关专利信息
1
一种降低不良率的吹瓶机吹瓶控制方法及控制装置
吹瓶控制方法 吹瓶机 气压 接触点 瓶胚
2
六轴自动平口胀接机器人
液压胀管器 支撑框架 红外距离传感器 机器人 液压控制箱
3
一种基于组合特征编码和DNA结合位点的预测方法
随机森林 位点 序列变体 样本 特征编码方法
4
水稻抗倒伏基因STRONG2的单倍型分子标记在水稻育种中的应用
水稻抗倒伏基因 染色体 标记 植物分子育种技术 位点
5
融合机器视觉的涤纶丝缺陷实时检测分类系统
融合机器视觉 检测分类系统 涤纶丝 光电传感器阵列 流分类器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号