摘要
本申请公开了一种机械臂控制方法及装置、电子设备和存储介质,涉及人工智能技术领,通过在机械臂控制模型对机械臂控制的过程中,结合基于视觉感知激励的方式进行奖励值重塑处理,确定重塑奖励值,可以降低奖励稀疏性,并将机械臂控制模型在机械臂控制过程中产生的各种信息生成样本数据,之后基于重塑奖励值对样本数据进行重要度设置,根据样本数据的重要度来进行采样,与现有技术中的均匀采样相比提高了采样效率,可以解决如何在机械臂控制过程中提高算法的采样效率,以及解决算法的奖励稀疏的技术问题,达到提高算法的采样效率,以及解决算法的奖励稀疏的技术效果。
技术关键词
机械臂控制方法
参数
生成样本数据
预测误差
标识
深度强化学习算法
偏差
机械臂控制装置
视觉
网络
电子设备
可读存储介质
存储计算机程序
人工智能技术
计算机程序产品