摘要
本发明提出一种基于噪声脉冲混合强化学习的单机械臂家具组装运动规划方法,其具体包括以下步骤:采集观测信息,搭建策略‑价值网络指导机械臂进行家具组装,并设计噪声脉冲神经网络作为策略网络;基于群体编码设计编码层,将观测信息转换为脉冲序列;设计具有噪声的脉冲神经层,根据脉冲序列,输出最终的脉冲活动;通过具有噪声的非脉冲的解码层,将脉冲活动转换为动作表达;设计动态调整噪声水平优化方法,修改损失函数来实现噪声‑策略的平衡;优化网络参数,得到最优模型,指导机械臂完成组装任务。本发明为机械臂在资源受限场景中持续作业提供了保证,推动智能装备在智能制造领域的实用化发展。
技术关键词
运动规划方法
脉冲
策略
噪声参数
深度强化学习
机械臂关节
家具组件
机械臂夹持器
机械臂末端执行器
解码
放电工作
强化学习框架
优化网络参数
编码
优化噪声
对象交互