摘要
本发明提供一种基于强化学习的Sim2Real模型构建方法及装置,涉及数据处理技术领域,方法包括:获取仿真环境与现实环境的评估指标;利用线性加权法,根据评估指标,量化仿真环境与现实环境指标之间的加权差异;搭建对仿真环境与真实环境之间的数据进行相互转换的Sim2Real模型;利用强化学习算法,以仿真环境与现实环境指标之间的加权差异最小为目标,对Sim2Real模型进行领域自适应训练,得到最终的Sim2Real模型。在本发明中,通过搭建对仿真环境和现实环境之间进行数据转换的Sim2Real模型,进行数据层面的调整,减少从仿真环境到真实环境的迁移误差。
技术关键词
仿真环境
模型构建方法
模型构建装置
指标
话题
线性加权法
强化学习算法
机器人
节点
消息转换
搭建模块
队列
仿真数据
图像
浮点数
传感器
数据处理技术
策略