摘要
本申请涉及一种基于大语言模型和微调优化的工具使用命令规划方法,其中,方法包括:基于先验知识获取、环境目标检测、执行步骤生成等命令规划方法基本流程,并通过人机交互的环节,且结合两种交互式可见探索策略和不可见探索策略进行在线命令规划,在面对未知场景未知任务时,将受人类认可的命令规划的重要信息存储起来;当存储的命令规划足够多时,面对相同的人类指令,此时再经过基于检索增强生成策略检索的离线命令规划框架,以在各个环节利用检索增强生成策略从已存储的正确命令规划的有效信息中检索出的结果。由此,解决了现有技术难以有效兼顾场景指令的通用性与生成执行步骤的可执行性等问题。
技术关键词
规划
命令
大语言模型
图片
数据采集策略
智能机器人
离线
人类
指令
在线
阶段
标签
计算机程序产品
处理器
模块
可读存储介质
视觉
存储器
场景
系统为您推荐了相关专利信息
自动检测方法
双向长短期记忆网络
深度学习语言模型
大语言模型
文本
强化学习方法
动作关系
自然语言文本
节点特征
大语言模型
占据栅格地图
三维点云地图构建
巡检路径规划方法
动态障碍物点云
地图构建系统