基于声纹辨别并与多人面对面交流的AI数字人装置及方法

AITNT
正文
推荐专利
基于声纹辨别并与多人面对面交流的AI数字人装置及方法
申请号:CN202510630345
申请日期:2025-05-16
公开号:CN120162601A
公开日期:2025-06-17
类型:发明专利
摘要
本申请公开了一种基于声纹辨别并与多人面对面交流的AI数字人装置及方法,通过麦克风阵列接收来自不同方向的声音信号,并通过红外测距传感器精确测量发言者与装置的距离,同时借助微型摄像头进行面部跟踪,确保了每个发言者的位置和眼睛位置能够被精确捕捉。其次,波束成形算法和RNNoise降噪模块的结合,使得装置能够从复杂环境中准确提取目标发言者的声音,并去除背景噪音,提升语音清晰度。通过梅尔频率倒谱系数和ECAPA‑TDNN深度学习模型对语音特征的高效提取,系统能够实现高精度的声纹识别,结合哈希表存储方式,快速对比发言者的声纹特征,进一步增强了识别准确性。
技术关键词
发言者 麦克风单元 梅尔频率倒谱系数 波束成形算法 声纹特征 显示屏 人脸特征信息 发言人 深度学习模型 降噪模块 麦克风阵列 微型摄像头 动画 哈希表 语音特征提取 红外测距传感器 高维特征向量
系统为您推荐了相关专利信息
1
一种基于声纹分析的齿轮性能分析方法及系统
性能分析方法 声纹特征 数据分析模块 异常信号 齿轮
2
基于多通道声学信息和改进SRU的膝关节健康状态早筛系统及方法
声学传感器 膝关节 信号采集设备 信号预处理模块 信号特征
3
一种基于深度学习的研讨型课堂高频词提取方法
音频特征数据 梅尔频率倒谱系数 递归神经网络模型 拾音设备 文本
4
交互方法、第一电子设备和第二电子设备
电子设备 交互方法 传感器 信号 音频
5
一种基于数字人多模态交互的法语沉浸式学习系统
学习系统 强化学习模型 卷积神经网络识别 记录学习进度 动态时间规整算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号