确定控制策略模型的方法及装置以及用于控制末端执行器的方法及装置

正文

推荐专利

申请号：CN202411457051

申请日期：2024-10-17

公开号：CN119347753B

公开日期：2025-11-25

类型：发明专利

摘要

本公开提供一种确定控制策略模型的方法、用于控制末端执行器的方法、用于控制末端执行器的设备、确定控制策略模型的装置、用于控制末端执行器的装置、电子设备、一种非易失性计算机可读存储介质、以及计算机程序产品。为了得到泛化性和鲁棒性高于第一控制策略模型的第二控制策略模型，本公开对第一控制策略模型通过强化学习的方案进一步调整以得到第二控制策略模型，并在调整过程中使用了特定的奖励分数，能够在保证控制策略模型在尽可能广泛地探索控制方案的情况下，避免在仿真环境内所训练的控制策略模型不符合物理约束，进而导致不能应用于物理环境中。

技术关键词

末端执行器控制策略模型多关节非易失性计算机可读存储介质对象计算机可执行代码接触点计算机可执行指令计算机程序产品网络处理器场景容器物理图像仿真环境作用力电子设备模块

确定控制策略模型的方法及装置以及用于控制末端执行器的方法及装置

站点导航

APP 下载