摘要
本发明公开了一种基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置,包括:多模态感知输入模块,包含双目灰度摄像头、RGB摄像头及四阵列定向麦克风;数据处理模块,对输入数据进行处理,并融合视觉与音频数据进行空间定位;联合注册模块,实现声纹与人脸的空间绑定;可视化交互输出模块:实现定向声纹增强、降噪处理及空间注册信息的AR可视化输出。其实现了基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置在使用时所采用的定位方案只为提供特定声源在空间中的位置,未对特定声音信息进行进一步的识别分类,且无法对多个声纹与人脸进行注册。
技术关键词
阵列麦克风
跟踪系统
灰度摄像头
RGB摄像头
数据处理模块
定向麦克风
融合视觉
人脸位置
降噪模块
语音活动检测
KCF算法
输入模块
输出模块
多模态
检测人脸
声纹特征
跟踪装置
智能眼镜