摘要
本发明涉及一种基于元学习微调的多模态大模型机器人控制方法,包括:针对OpenVLA模型进行元学习预训练,得到预训练好的VLA模型;之后进行任务特定微调,得到微调后的VLA模型;将当前视觉数据、语言提示词、机器人传感器数据以及任务目标数据图输入微调后的VLA模型,输出得到决策控制指令,用于相应控制机器人的工作状态。与现有技术相比,本发明通过在多样化的任务上进行元学习预训练,提取通用特征和策略,以提升模型的泛化能力;此外,在具体任务中,通过少量新样本进行快速微调,使模型能够在短时间内适应新的任务要求;并结合视觉、文字提示词和机器人控制的多模态信息,以提高模型的感知和决策能力,有效提升机器人在复杂环境中的适应性和操作效率。
技术关键词
机器人控制方法
机器人传感器
数据
元学习方法
决策
触觉传感器
通用特征
标记
大语言模型
生成动作
视觉特征
自然语言
控制策略
图像
机械臂
物体
系统为您推荐了相关专利信息
射线追踪方法
数据驱动模型
多径
数据驱动方法
场景
移动充电机器人
充电调度方法
指数
时间段
预测等待时间
数据中心
选址规划方法
决策
节点
两阶段鲁棒优化
轴向柱塞泵
故障诊断方法
样本
结构特征提取
特征提取器