一种基于运动基元的分层生成对抗模仿学习方法

正文

推荐专利

申请号：CN202510859583

申请日期：2025-06-25

公开号：CN120680505A

公开日期：2025-09-23

类型：发明专利

摘要

一种基于运动基元的分层生成对抗模仿学习(GAIL)方法，旨在提升GAIL算法在高维状态与动作空间中的训练稳定性与泛化能力，针对其因对抗关系导致样本效率低、对抗训练不稳定及难以建模复杂运动模式的问题，提出一种基于Transformer结构的优化生成策略，从时序特征建模与轨迹连贯性控制两方面同时提升生成轨迹的质量，并通过设计具备任务适应性的改进判别器，增强模型对高维连续控制任务的鲁棒性；在此基础上，构建高层‑低层分层策略结构，采用双层策略和动态权重调度的框架，实现多任务间的策略迁移与复杂运动模式的自适应生成，从而显著提升模仿学习系统的学习效率与策略泛化能力。

技术关键词

基元模仿学习方法生成轨迹分层策略梯度方法运动机械臂示教生成数据集抽样方法学习系统解码器编码器时序特征决策机器人变量

系统为您推荐了相关专利信息

一种基于图像-文本预训练模型的少样本分类方法

样本分类方法基元预训练模型原型分支

深度强化学习引导的强适应性锂离子电池状态估计方法

深度强化学习算法状态估计方法 PID控制器锂离子电池状态空间方程

一种车道级地图构建方法、装置、设备及存储介质

车道级地图密度分布矩阵栅格图像处理模型生成轨迹

一种面向电磁散射领域的层次化知识表达方法及装置

知识表达方法电磁动态元素数据

基于人工智能的电推进器轨迹跟踪控制方法及系统

推进器轨迹预测模型轨迹跟踪控制方法序列强化学习模型

一种基于运动基元的分层生成对抗模仿学习方法

站点导航

APP 下载