摘要
本申请提供了一种基于语音控制的XR交互方法、装置及设备,属于人机交互技术领域。该方法包括:接收多模态传感器获取的多模态交互数据流;对多模态交互数据流中语音信号识别解析,以确定相应的语音控制指令;其中,语音控制指令包括操作意图及空间描述;空间描述为用户对目标操作对象的空间约束信息;基于语音控制指令及多模态交互数据流中与语音信号同步的一种或多种非语音行为信息,确定相应的目标交互空间区域;根据目标交互空间区域中各可操作对象信息,匹配与语音控制指令对应的目标操作对象,并根据目标操作对象执行操作意图对应的XR交互操作。从而实现高精度、动态适应性强且可靠性高的语音控制交互。
技术关键词
语音控制指令
空间约束条件
多模态交互
多模态传感器
非语音
对象
运动状态检测
交互方法
意图
坐标系
语音提示信息
人机交互技术
动态闪烁
基准
信号
系统为您推荐了相关专利信息
资源调度系统
服务终端
医疗场景
多模态传感器
医院
液压机械臂结构
机械臂架
末端执行器
无迹卡尔曼滤波算法
异构传感器
能源管理模块
智能控制系统
视觉伺服定位
生物电传感器
智能感知模块
监测方法
数据
参数耦合关系
氟橡胶材料
设备运行参数
自动校准方法
深度强化学习模型
量子退火算法
多模态传感器
半导体