基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置

正文

推荐专利

申请号：CN202510939162

申请日期：2025-07-08

公开号：CN120766334A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置，包括：多模态感知输入模块，包含双目灰度摄像头、RGB摄像头及四阵列定向麦克风；数据处理模块，对输入数据进行处理，并融合视觉与音频数据进行空间定位；联合注册模块，实现声纹与人脸的空间绑定；可视化交互输出模块：实现定向声纹增强、降噪处理及空间注册信息的AR可视化输出。其实现了基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置在使用时所采用的定位方案只为提供特定声源在空间中的位置，未对特定声音信息进行进一步的识别分类，且无法对多个声纹与人脸进行注册。

技术关键词

阵列麦克风跟踪系统灰度摄像头 RGB摄像头数据处理模块定向麦克风融合视觉人脸位置降噪模块语音活动检测 KCF算法输入模块输出模块多模态检测人脸声纹特征跟踪装置智能眼镜

基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置

站点导航

APP 下载