世界模型和智能体训练方法、机器人及其控制方法和系统

正文

推荐专利

申请号：CN202510881737

申请日期：2025-06-27

公开号：CN120873585A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种世界模型和智能体训练方法、机器人及其控制方法和系统。本发明通过引入任务相关的上下文信息，激活世界模型对特定场景动力学的预测能力。这使得单一模型能够适应不同场景下的动力学特性，有效降低了动力学模型误差。利用元状态正则化学习了一个统一的、仅包含任务核心信息的隐状态表示，确保模型提取的是与任务目标强相关的特征，过滤掉场景间的无关差异，从而减小状态表示误差，并提升了表示的通用性。通过元价值正则化缓解了动力学模型学习与策略学习目标不一致的问题，这使得模型在学习动力学时，能主动考虑其对后续策略学习的价值，从而使两者目标更为对齐。

技术关键词

智能体训练方法参数模型训练方法解码函数环境状态预测解码信息机器人控制方法机器人控制系统编码模型更新训练智能体模型误差样本场景存储器策略处理器核心

世界模型和智能体训练方法、机器人及其控制方法和系统

站点导航

APP 下载