基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置

AITNT
正文
推荐专利
基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置
申请号:CN202510939162
申请日期:2025-07-08
公开号:CN120766334A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置,包括:多模态感知输入模块,包含双目灰度摄像头、RGB摄像头及四阵列定向麦克风;数据处理模块,对输入数据进行处理,并融合视觉与音频数据进行空间定位;联合注册模块,实现声纹与人脸的空间绑定;可视化交互输出模块:实现定向声纹增强、降噪处理及空间注册信息的AR可视化输出。其实现了基于双目VISLAM及四阵列麦克风的空间语音声纹人脸联合注册与跟踪系统与装置在使用时所采用的定位方案只为提供特定声源在空间中的位置,未对特定声音信息进行进一步的识别分类,且无法对多个声纹与人脸进行注册。
技术关键词
阵列麦克风 跟踪系统 灰度摄像头 RGB摄像头 数据处理模块 定向麦克风 融合视觉 人脸位置 降噪模块 语音活动检测 KCF算法 输入模块 输出模块 多模态 检测人脸 声纹特征 跟踪装置 智能眼镜
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号