多模态指令交互方法、系统、计算设备及存储介质

AITNT
正文
推荐专利
多模态指令交互方法、系统、计算设备及存储介质
申请号:CN202411122271
申请日期:2024-08-15
公开号:CN119556791A
公开日期:2025-03-04
类型:发明专利
摘要
本申请公开一种基于虚拟人物的多模态指令交互方法、系统、计算设备及存储介质,所述方法包括获取用户姿态数据并进行识别,获取姿态数据对应的第一操作指令;获取用户的语音数据并进行识别获取用户的意图数据,根据意图数据获取对应的第二操作指令;将第一操作指令和第二操作指令进行时间戳对齐,并计算其在语义空间的相似度,用加权平均的方法对第一操作指令和第二操作指令进行融合并进行动态调整,得到优先级最高的指令作为最终操作指令控制虚拟场景中的物体移动。本申请将手势指令和语音指令进行了深度融合,极大地拓展了用户与虚拟环境的交互空间,突破传统单一交互模式的局限,为用户提供更加自然、高效、智能的沉浸式体验。
技术关键词
交互方法 计算机可执行指令 深度学习算法 马达振动 视线追踪器 交互系统 手势 触觉反馈装置 意图 音频采集设备 数据获取模块 多模态 语音 姿态传感器 语义 深度相机 手柄控制器
系统为您推荐了相关专利信息
1
一种机械臂抓取姿态分析方法、装置及电子设备
点云图像 机械臂 机器人摄像头 物体检测模型 分析方法
2
视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品
视频生成模型 视频帧 视频生成方法 数据处理模块 计算机可执行指令
3
基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品
矩阵 线性 计算机程序产品 数据 参数
4
一种基于多模态大模型的视频理解方法、设备及介质
视频理解方法 视频帧 多模态 序列 视觉特征
5
一种基于光伏电站消防物联网的自动监控方法及系统
智能消防炮 光伏电站 自动监控方法 立体视觉定位 火情信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号