摘要
本发明公开了基于分层强化学习和大模型提示工程的人机协同任务规划方法。该方法包括:当机器人在空间做在轨加注操作任务的场景下,设计在轨加注操作任务的实验流程,基于实验流程,设计状态矩阵和If‑then形式的规则;获取机器人对在轨加注操作任务的可执行基本动作,基于状态矩阵和可执行基本动作,得到状态转移模型;获取选项‑评论家架构中的策略函数且设置若干个回合;初始化策略函数,得到初始化后的策略函数;在第一个回合中,初始化状态矩阵,基于初始化后状态矩阵中的初始状态、初始化后的策略函数和状态转移模型,得到一条轨迹数据。本发明解决了现有技术中的人机协同规划任务,规划效率低的技术问题。
技术关键词
状态转移模型
分层强化学习
人机协同
机器人
策略
轨迹
矩阵
数据
强化学习方法
规划
样本
工具箱
自然语言
基础
场景
人类
系统为您推荐了相关专利信息
定位抓取方法
检测开关
仓储机器人
识别标签
图像特征数据
三维路径规划方法
移动机器人
节点
蚁群算法
蚂蚁
深度强化学习方法
注意力机制
解码器
编码器
决策