一种基于条件扩散模型挑选技能的机器人双层控制方法

正文

推荐专利

申请号：CN202411700692

申请日期：2024-11-26

公开号：CN119328763B

公开日期：2025-10-24

类型：发明专利

摘要

本发明公开了一种基于条件扩散模型挑选技能的机器人双层控制方法，将原先时间跨度漫长的强化学习轨迹通过双层策略构筑，将其抽象成为上层策略选择技能执行的较短时间跨度的任务；在策略预训练阶段，引入额外条件将机器人位姿状态以及选取技能进行了平衡的绑定，从而提高了机器人在强化学习环境中的探索速率，使得机器人智能体能够在更短时间内组合不同的技能以完成任务；在策略微调阶段引入强化学习PPO算法以最大化累计奖赏为目标，不断微调上层技能选取策略的技能选取策略，直至模型收敛。本发明能够在长时间跨度的机器人任务上将原先的动作空间下采样的较小的技能空间，并绑定不同位姿状态和其技能的相关性，从而减少技能探索空间以加速探索。

技术关键词

双层控制方法机器人位姿序列控制策略模型强化学习环境编码器阶段代表轨迹特征解码器策略更新数据网络算法切片

系统为您推荐了相关专利信息

一种人形机器人拟人奔跑动作的控制方法

人形机器人关键帧学习优化方法轨迹关节电机

并发症背景下基于手机传感器的抑郁情绪分析方法

抑郁情绪分析方法数据特征提取时间序列信息手机传感器特征

一种基于脑电信号的中文连续语言文本重建方法

文本序列电信号预训练模型动态解码

金融产品收益风险预警方法及系统

风险预警方法风险预测模型金融异常数据参数

一种基于规则配置和AI学习的水利行业模拟仿真数据生成方法、工具、设备及其介质

仿真数据非临时性计算机可读存储介质 LSTM模型生成规则编码器

一种基于条件扩散模型挑选技能的机器人双层控制方法

站点导航

APP 下载