摘要
本发明公开一种基于生成对抗模仿学习的机械臂轨迹规划方法及装置,涉及机械臂技术领域。所述方法包括:采集机械臂关节状态数据;将所述机械臂关节状态数据输入到经过训练的改进的生成对抗模仿学习模型中,得到机械臂动作,循环执行采集数据‑输入改进的生成对抗模仿学习模型,最终得到机械臂轨迹;其中,改进的生成对抗模仿学习模型中,奖励函数为动态奖励函数,动态奖励函数中的参数根据任务完成度动态调整。本申请的技术方案,有利于提高学习效率。稳定性上有显著提升,能更好地模仿专家轨迹,大幅提高了基于生成对抗模仿学习的机械臂轨迹规划的成功率和准确性,为机械臂在材料合成等领域的实际应用奠定了坚实基础。
技术关键词
机械臂关节
机械臂轨迹规划
计算机可读取存储介质
计算机可读指令
动态
数据
机械臂技术
归一化方法
生成标签
代表
处理器
模块
参数
存储器
阶段
系统为您推荐了相关专利信息
FFT算法
加窗插值
数字信号处理
数据分析方法
瞬态特征
救援场景
三维重建方法
预训练模型
特征点
度度量方法
功率变换器
预测控制方法
模型预测控制框架
超级电容
电感
固件加密方法
生成动态密钥
标识符
固件加密系统
双重防护