机器人避障神经网络模型训练方法、设备及存储介质

正文

推荐专利

申请号：CN202411472445

申请日期：2024-10-21

公开号：CN119539017A

公开日期：2025-02-28

类型：发明专利

摘要

本发明实施例涉及一种机器人避障神经网络模型训练方法、设备及存储介质。该方法包括：在预设的机器人避障仿真环境下，将机器人基于预设的随机弹性奖励机制和强化学习神经网络，在避障过程中产生的动作决策、反馈的运行状态以及相应的奖励记录，并形成随机奖励池；利用所述随机奖励池，并通过添加强化学习动作的随机噪声，共同训练所述强化学习神经网络，更新网络参数；在实际运行环境中，基于所述随机弹性奖励机制根据获得的机器人在避障过程中产生的动作决策值和反馈的运行状态值，训练所述强化学习神经网络，得到机器人的避障神经网络模型。本发明实施例的技术方案能够有效提高强化学习避障效率和实用性。

技术关键词

机器人避障仿真环境更新网络参数神经网络模型顶点速度计算机可执行指令机制随机噪声决策全局路径规划神经网络参数数学模型动作噪声地图轨迹

系统为您推荐了相关专利信息

一种基于KD-tree的历史井网拟合方法、装置、设备以及介质

油田顶点变量电子设备处理器

调整执行策略的方法及装置、非易失性存储介质

非易失性存储介质策略性能预测模型参数序列

一种基于地质智能评估的隧道三维选线设计方法

三维地质模型钻孔地质勘探数据坐标样本

一种基于压力变化的管道智能冲洗控制方法及系统

冲洗控制方法神经网络模型模糊逻辑喷头管道堵塞

一种时间敏感网络增量路由调度方法、系统、设备及存储介质

时间敏感网络 Dijkstra算法交换机贪婪策略链路

机器人避障神经网络模型训练方法、设备及存储介质

站点导航

APP 下载