摘要
本发明公开了一种基于大语言模型的狭小空间机械臂路径规划方法。本发明采用强化学习进行狭小空间路径规划,并构建生成路径多尺度属性加权函数为强化学习的奖励函数,利用大语言模型(LLM)引导生成可直接运行的奖励函数表达形式和与之匹配的强化学习训练算法,结合强化学习训练指标引导大语言模型对生成的奖励函数进行优化,解决了传统强化学习中奖励函数制定困难,需具备大量经验的缺点,能快速找到可行路径、生成路径质量高,直接可用;可通过权重动态调整实现路径长度、安全性、执行精度的平衡,支持从狭小空间避障到精密装配等不同场景的快速迁移,并且可以兼顾路径质量和探索速度,适用于复杂狭小环境下的机械臂路径规划。
技术关键词
训练算法
强化学习环境
大语言模型
仿真环境
三维模型
机械臂末端执行器
算法原理
规划
平滑度
空间机械臂
能量消耗
障碍物
生成多尺度
关节力矩
生成结构
指标
系统为您推荐了相关专利信息
大语言模型
语言模型训练方法
异常用户
样本
种子
变压器匝间绝缘
故障仿真方法
变压器绕组
仿真模型
三维模型
人工智能教育
青少年
终端设备
教学操作系统
学生