基于声纹辨别并与多人面对面交流的AI数字人装置及方法

正文

推荐专利

申请号：CN202510630345

申请日期：2025-05-16

公开号：CN120162601A

公开日期：2025-06-17

类型：发明专利

摘要

本申请公开了一种基于声纹辨别并与多人面对面交流的AI数字人装置及方法，通过麦克风阵列接收来自不同方向的声音信号，并通过红外测距传感器精确测量发言者与装置的距离，同时借助微型摄像头进行面部跟踪，确保了每个发言者的位置和眼睛位置能够被精确捕捉。其次，波束成形算法和RNNoise降噪模块的结合，使得装置能够从复杂环境中准确提取目标发言者的声音，并去除背景噪音，提升语音清晰度。通过梅尔频率倒谱系数和ECAPA‑TDNN深度学习模型对语音特征的高效提取，系统能够实现高精度的声纹识别，结合哈希表存储方式，快速对比发言者的声纹特征，进一步增强了识别准确性。

技术关键词

发言者麦克风单元梅尔频率倒谱系数波束成形算法声纹特征显示屏人脸特征信息发言人深度学习模型降噪模块麦克风阵列微型摄像头动画哈希表语音特征提取红外测距传感器高维特征向量

系统为您推荐了相关专利信息

一种基于声纹分析的齿轮性能分析方法及系统

性能分析方法声纹特征数据分析模块异常信号齿轮

基于多通道声学信息和改进SRU的膝关节健康状态早筛系统及方法

声学传感器膝关节信号采集设备信号预处理模块信号特征

一种基于深度学习的研讨型课堂高频词提取方法

音频特征数据梅尔频率倒谱系数递归神经网络模型拾音设备文本

交互方法、第一电子设备和第二电子设备

电子设备交互方法传感器信号音频

一种基于数字人多模态交互的法语沉浸式学习系统

学习系统强化学习模型卷积神经网络识别记录学习进度动态时间规整算法

基于声纹辨别并与多人面对面交流的AI数字人装置及方法

站点导航

APP 下载