摘要
本申请提出一种导航模型的训练方法及导航方法。一种导航模型的训练方法包括:获取第一高精度全局地图、初始深度学习模型;获取第一机器人当前时刻的状态数据和雷达数据;根据状态数据以及第一高精度全局地图,计算目标奖励值;根据状态数据、雷达数据以及第一高精度全局地图,确定第一输入数据集以及第二输入数据集;利用初始深度学习模型处理第一输入数据集以及第二输入数据集,得到目标损失函数;利用目标损失函数、目标奖励值调整初始深度学习模型的权重,得到第一深度学习模型;第一深度学习模型包括第一Actor网络、第一Critic网络;更新当前训练次数;检测当前训练次数是否大于训练次数阈值;在确定大于的情况下,将第一Actor网络作为导航模型。
技术关键词
全局地图
深度学习模型
多层感知器
噪声雷达
神经网络模型
距离信息
采样点
数据
无噪声
机器人
特征值
终点
导航方法
门控循环单元
生成控制指令
精度
模块
系统为您推荐了相关专利信息
面部特征图像
神经网络模型
感知损失函数
生成特征
像素矩阵
文本理解
模型训练方法
多模态
神经网络模型
关键帧
信息管理方法
神经网络模型
网页请求信息
可读存储介质
标签
海洋环境参数
滑动窗口机制
异常状态
时间序列信息
主成分分析方法
建模识别方法
形态
信息提取方法
阶段
道路三维模型