面向多任务的智能体训练方法和决策方法及装置

正文

推荐专利

申请号：CN202510477428

申请日期：2025-04-16

公开号：CN119988988B

公开日期：2025-08-01

类型：发明专利

摘要

公开了一种面向多任务的智能体训练方法和决策方法及装置，训练方法包括：将训练样本中初始任务状态输入混合编码器获取预估任务特征；将预估任务特征输入共享策略网络生成预估初步动作；将预估任务特征和预估初步动作输入动作校正策略网络生成预估校正动作；将预估初步动作和预估校正动作输入动作校正模块得到预估下一步动作；执行预估下一步动作获取预估下一任务状态；基于初始任务状态、预估下一任务状态和目标任务状态确定稀疏奖励和密集奖励；将预估下一任务状态作为初始任务状态并返回获取预估任务特征步骤，直至完成训练样本中任务；基于每个训练样本所有稀疏奖励、所有密集奖励，更新共享策略网络、动作校正策略网络和混合编码器的参数。

技术关键词

智能体训练方法人形机器人面向多任务混合编码器校正策略校正模块无人机决策方法网络子模块机械手地点无人车训练样本集物体训练装置指令计算机程序产品

系统为您推荐了相关专利信息

一种端到端人形机器人操作行为和技能训练方法及数字仿真系统

技能训练方法执行人形机器人数字样机模型数字仿真系统行走模型

一种基于分层对抗的智能体训练方法和装置

智能体训练方法简化智能参数强化学习算法无人机

机器人关节的控制方法、系统及人形机器人

关节电机电机编码器角速度信息机器人视觉人形机器人关节

一种集成在机器人关节部位的少差齿减速器

机器人关节减速器齿圈机器人主控系统反馈系统

一种用于人形机器人的伺服电机旋转执行器

人形机器人卡位机构伺服电机旋转执行器技术顶出机构

面向多任务的智能体训练方法和决策方法及装置

站点导航

APP 下载