摘要
本申请公开了一种基于多模态输入的机器人运动交互系统和方法,通过基于多模态输入的机器人运动交互系统会在与人类的交互过程中使用视觉、听觉、触觉等多种模态的输入,将摄像头拍摄的画面、麦克风录得的语音、人传送给机器人的文本、机器人回复人的文本、人对机器人的触摸等多种信号进行处理,提取其中的语义,根据机器人当前的状态和程序约束,通过决策系统给出应该响应的动作,最后机器人执行该动作,本方案通过多模态输入模块接收多种输入信号,并通过统一接口连接信号处理模块、决策系统和执行模块,使得系统能够综合处理视觉、听觉和触觉信号,简化系统结构,提高系统的智能化水平和交互能力。
技术关键词
运动交互系统
信号处理模块
多模态
输入模块
机器人对用户
决策系统
生成动作
麦克风模块
触觉传感器
文本
语义
运动交互方法
摄像头模块
听觉
视觉
语音处理单元
简化系统结构
运动控制单元
系统为您推荐了相关专利信息
时空分布特征
多模态
调控方法
异常事件
预警机制
特征识别方法
图像处理
特征识别系统
多尺度特征提取
集成学习模型
分类识别方法
交叉注意力机制
表情数据处理
数据处理模块
特征提取模块
轨迹
图像增强模块
运动估计模块
多模态特征
视频帧
数据挖掘系统
烟叶病害
多模态数据采集
可见光图像
数据处理单元