多模态信息识别的人机交互方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411508162

申请日期：2024-10-28

公开号：CN119472995A

公开日期：2025-02-18

类型：发明专利

摘要

本申请公开了一种多模态信息识别的人机交互方法、装置、设备及存储介质，利用多种传感器融合人脸、眼球、语音、身体姿势等信息，实现多模态识别，增加人机交互的准确性和多样性，同时通过多模态信息判断用户的交互意图，识别不同说话者的方位和语音内容，实现被动或主动与不同用户进行连续的对话，解决了现有技术中唤醒词机制进行人机语音交互存在的嘈杂环境下识别准确率低，以及无法实现在多人对话场景中，可以与多人在对话内容和对话方式上进行流畅的对话的技术问题。

技术关键词

人机交互方法多模态信息生物识别信息交互动作人脸识别信息存储程序代码麦克风阵列传感器模块人机语音交互音频特征信息人机交互设备人机交互装置传感器融合密度音色特征环境传感器可读存储介质

系统为您推荐了相关专利信息

一种微手势交互识别方法、装置、电子设备及介质

交互识别方法顶点索引交互动作命令

基于多模态信息的云端一体化情绪识别的个性化方法

情绪识别模型个性化方法多模态信息时间序列特征多模态特征融合

一种基于多模态时空特征融合的交通行为实时识别方法

识别方法视觉特征道路监控摄像机交通信号灯状态时序分析模块

具有自动报警模块的高压开关柜及方法

高压开关柜气体检测模块进气管道排气箱进气模块

优化多模态大模型Prompt的产品风格分类方法、系统及设备

风格分类方法融合多模态信息构建分类模型大语言模型视觉特征

多模态信息识别的人机交互方法、装置、设备及存储介质

站点导航

APP 下载