摘要
本发明公开了一种基于多模态检测的机器人寻物方法,包括以下步骤:S1、首先使用者通过与机器人人机语音交互,使得机器人获取需要寻找的物体属性;S2、人机交互后,机器人便开始寻找,获取时间同步的RGB和depth图像;S3、人机根据获取的RGB和depth图像使用多模态模型推理并获取推理结果;S4、机器人根据推理结果判断是否检测到需要寻找的物体,否,继续移动寻找获取时间同步的RGB和depth图像。本发明所述的一种基于多模态检测的机器人寻物方法,基于多模态检测的机器人寻物方法的用户操作简单,无需任何设置,通过语音交互的方式直接输入物品,寻找任何常见的物品,并可以指定需要寻找的物品的属性,比如颜色、形状等,无需APP输入物品类别。
技术关键词
寻物方法
多模态
机器人人机
物体
时间同步
语音人机交互
控制机器人运动
人形机器人
深度相机
文本
坐标
图像处理
指令
麦克风
颜色
轮式
系统为您推荐了相关专利信息
语音情感识别
智能优化系统
智能优化方法
视频编码参数
深度学习模型
局部放电状态
监测终端
平面移动装置
多模态传感器
诊断系统
刀具磨损检测方法
刀具磨损状态
多模态
卷积神经网络模型
分布特征