摘要
本发明公开了微重力环境下巡视探测器强化学习训练方法及电子设备,包括步骤:获取天体表面的图片信息,并基于图片信息构建天体的三维地形模型,以URDF格式定义巡视探测器的模型信息;在物理引擎中导入巡视探测器的模型信息和三维地形模型;施加各种不同类型的控制量来模拟探测器运动,生成仿真数据集;建立动力学环境与强化学习算法交互的标准接口,添加强化学习模块,将仿真数据集输入到强化学习模块进行强化学习训练。利用三角剖分和地形重建方法,将天体表面照片和三维扫描图转换到训练环境中,作为环境状态的一部分输入强化学习算法,进而得到探测器每一步动作决策,有利于探测器基于不同的任务需求开展控制决策模型的快速训练和部署。
技术关键词
巡视探测器
三维地形模型
学习训练方法
强化学习算法
微重力
仿真数据
仿真环境
关键特征点
定义
地形重建方法
三角剖分方法
三角测量技术
图片
三维重建算法
关节
传感器
深度Q网络
电子设备
梯度方法
系统为您推荐了相关专利信息
电商
电力
深度强化学习算法
模糊隶属度函数
学习训练方法
深度学习分析
乘客历史数据
客舱
运营特征
强化学习算法
标准单元
深度强化学习
布局优化方法
机器可读存储介质
视觉特征
空间相关性系数
数据传输方法
传输路径
链路丢包率
时间序列预测模型