摘要
本申请实施例提供一种模型训练方法、挖掘机控制方法、装置、设备及挖掘机。该模型训练方法包括:首先,根据模拟环境中总挖掘区域的第一环境信息以及样本挖掘机的第一运动信息,构建第一状态空间;之后,根据样本挖掘机的第一控制指令,构建第一动作空间;然后,根据预先设定的奖励函数以及安全约束条件,训练第一初始模型中的第一策略网络,得到初始挖掘机控制模型;进一步的,将当前挖掘区域的第二环境信息以及第二运动信息构建第二状态空间,并输入至初始挖掘机控制模型,获取第二动作空间;最后,根据奖励函数以及动作值函数,训练第二初始模型中的第二策略网络,得到目标挖掘机控制模型。本申请提高了挖掘机控制模型输出控制指令的准确度。
技术关键词
模型训练方法
挖掘机控制方法
计算机执行指令
样本
铲斗位置
挖掘机控制装置
策略
网络
关节
运动
挖掘机动臂
存储器
模型训练装置
处理器
模块
障碍物
电子设备
点云
数据
系统为您推荐了相关专利信息
电机参数辨识方法
数据
超参数
协方差矩阵
模型更新
机械故障预测方法
机械设备故障
回归预测模型
分类预测模型
梯度提升决策树算法