一种基于深度语音嵌入的声纹识别方法及系统

正文

推荐专利

申请号：CN202510751007

申请日期：2025-06-06

公开号：CN120581014A

公开日期：2025-09-02

类型：发明专利

摘要

本发明提供了一种基于深度语音嵌入的声纹识别方法及系统，包括：获取语音数据，并基于语音数据得到缓冲波形数据；基于缓冲波形数据和预设采样率进行重采样，获取采样语音数据；基于采样语音数据和预设窗口时间进行段落分割，得到分割语音数据；基于分割语音数据进行数据增强处理，获取增强语音数据；基于预训练模型对增强语音数据进行特征提取，获取高维特征向量；基于高维特征向量计算帧级统计信息，并基于注意力机制和帧级统计信息得到段落特征向量；基于段落特征向量进行特征向量匹配，从而进行身份映射，实现声纹识别。本发明提出的一种基于深度语音嵌入的声纹识别方法及系统，保证了声纹识别的准确性，大大提高了声纹识别的效率和可靠性。

技术关键词

声纹识别方法高维特征向量深度学习网络模型预训练模型大规模语音数据噪声频谱采样率注意力机制波形声纹识别系统身份缓冲方法深度神经网络特征提取模块滤波估计算法

系统为您推荐了相关专利信息

基于计算机视觉的斑海豹姿态、体型和分布信息智能识别方法

信息智能识别方法关键点识别体型预训练模型无人机

基于深度学习的岩土体参数智能反演系统

网络健康状态岩土体子模块传感器深度Q网络

基于大模型的三方数据自动计费方法、系统及电子设备

自动计费方法计费规则计费策略训练机器学习模型计费引擎

预训练模型微调方法、图像分类方法、介质、设备及产品

样本预训练模型分片数据微调方法

一种海洋多模态数据处理方法、装置、设备及存储介质

多模态数据处理方法海洋环境数据深度学习算法高维特征向量多源数据采集系统

一种基于深度语音嵌入的声纹识别方法及系统

站点导航

APP 下载