摘要
本发明公开了一种基于多模态大模型的家务助理机器人,属于机器人控制、自然语言处理、计算机视觉的交叉领域,包括:静态场景处理模块、动作模块和控制模块;静态场景处理模块用于扫描工作环境,并对工作环境进行3D建模;动作模块用于实现机器人的水平方向的运动,以及对物体的交互动作;控制模块用于控制动作模块的动作,并基于多模态大模型LLaVa‑13B构建监督模型,基于监督模型对动作进行评价,再基于评价结果对动作进行调整。本发明的机器人对家用场景的泛化能力更强,比如家用场景中对特定物体的捡取、擦拭清洁、整理等任务高效的执行,在积累特定任务数据后,扩展机器人的能力,极大的提高用户的生活幸福指数。
技术关键词
动作模块
助理机器人
交互动作
物体
路径规划单元
机械臂单元
多模态
生成控制指令
控制模块
场景
大语言模型
扫描单元
运动
机器人控制
语义向量
计算机视觉
自然语言
系统为您推荐了相关专利信息
机械手控制方法
策略更新
决策
仿真环境
网络评估策略
时间偏移量
图像拼接
相机图像数据
处理器
子模块
无监督深度学习
恢复方法
DNN模型
空间光调制器调制
光学系统
双臂机器人
李雅普诺夫函数
机械臂末端执行器
受限
物体