多模态指令交互方法、系统、计算设备及存储介质

正文

推荐专利

申请号：CN202411122271

申请日期：2024-08-15

公开号：CN119556791A

公开日期：2025-03-04

类型：发明专利

摘要

本申请公开一种基于虚拟人物的多模态指令交互方法、系统、计算设备及存储介质，所述方法包括获取用户姿态数据并进行识别，获取姿态数据对应的第一操作指令；获取用户的语音数据并进行识别获取用户的意图数据，根据意图数据获取对应的第二操作指令；将第一操作指令和第二操作指令进行时间戳对齐，并计算其在语义空间的相似度，用加权平均的方法对第一操作指令和第二操作指令进行融合并进行动态调整，得到优先级最高的指令作为最终操作指令控制虚拟场景中的物体移动。本申请将手势指令和语音指令进行了深度融合，极大地拓展了用户与虚拟环境的交互空间，突破传统单一交互模式的局限，为用户提供更加自然、高效、智能的沉浸式体验。

技术关键词

交互方法计算机可执行指令深度学习算法马达振动视线追踪器交互系统手势触觉反馈装置意图音频采集设备数据获取模块多模态语音姿态传感器语义深度相机手柄控制器

系统为您推荐了相关专利信息

一种机械臂抓取姿态分析方法、装置及电子设备

点云图像机械臂机器人摄像头物体检测模型分析方法

视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品

视频生成模型视频帧视频生成方法数据处理模块计算机可执行指令

基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品

矩阵线性计算机程序产品数据参数

一种基于多模态大模型的视频理解方法、设备及介质

视频理解方法视频帧多模态序列视觉特征

一种基于光伏电站消防物联网的自动监控方法及系统

智能消防炮光伏电站自动监控方法立体视觉定位火情信息

多模态指令交互方法、系统、计算设备及存储介质

站点导航

APP 下载