摘要
本发明涉及基于脉冲混合强化学习组装任务的单机械臂运动规划方法,包括:将机械臂运动划分为n个阶段,对于每个阶段的终点设计稠密奖励函数;利用场景中机械臂和目标部件的观测信息和动作信息维度,设计一个脉冲编码模块和具有动态阈值的脉冲神经网络模块,通过其中的脉冲神经层来提取特征,输出最终的脉冲活动;设计一个群体解码模块,将脉冲神经网络输出的脉冲活动解码转换为更直观的动作空间表达;设计脉冲混合强化学习SAC模型,在策略网络中结合了上述三个模块,而在价值网络中使用深度神经网络,利用脉冲混合强化学习模型优化各个网络中的参数,从而实现高推理速度,同时赋予网络稀疏计算和高精度性能的特点,指导机械臂完成组装任务。
技术关键词
末端执行器
解码模块
夹爪位置
阶段
编码模块
策略
机械臂夹持器
深度神经网络
放电工作
多层感知机
数据
对准连接器
生成脉冲信号
强化学习模型
参数
系统为您推荐了相关专利信息
音视频解码系统
解码模块
智能功耗管理
主控单元
音视频解码方法
图像检测方法
航拍
生成算法
特征加权融合
后续图像处理
智能仓储管理系统
融合人工智能
物流仓库管理
货车
可视化模块
线路故障诊断方法
海洋牧场
故障诊断模型
供电系统
多尺度特征提取