一种基于深度语音嵌入的声纹识别方法及系统

AITNT
正文
推荐专利
一种基于深度语音嵌入的声纹识别方法及系统
申请号:CN202510751007
申请日期:2025-06-06
公开号:CN120581014A
公开日期:2025-09-02
类型:发明专利
摘要
本发明提供了一种基于深度语音嵌入的声纹识别方法及系统,包括:获取语音数据,并基于语音数据得到缓冲波形数据;基于缓冲波形数据和预设采样率进行重采样,获取采样语音数据;基于采样语音数据和预设窗口时间进行段落分割,得到分割语音数据;基于分割语音数据进行数据增强处理,获取增强语音数据;基于预训练模型对增强语音数据进行特征提取,获取高维特征向量;基于高维特征向量计算帧级统计信息,并基于注意力机制和帧级统计信息得到段落特征向量;基于段落特征向量进行特征向量匹配,从而进行身份映射,实现声纹识别。本发明提出的一种基于深度语音嵌入的声纹识别方法及系统,保证了声纹识别的准确性,大大提高了声纹识别的效率和可靠性。
技术关键词
声纹识别方法 高维特征向量 深度学习网络模型 预训练模型 大规模语音数据 噪声频谱 采样率 注意力机制 波形 声纹识别系统 身份 缓冲方法 深度神经网络 特征提取模块 滤波 估计算法
系统为您推荐了相关专利信息
1
基于计算机视觉的斑海豹姿态、体型和分布信息智能识别方法
信息智能识别方法 关键点识别 体型 预训练模型 无人机
2
基于深度学习的岩土体参数智能反演系统
网络健康状态 岩土体 子模块 传感器 深度Q网络
3
基于大模型的三方数据自动计费方法、系统及电子设备
自动计费方法 计费规则 计费策略 训练机器学习模型 计费引擎
4
预训练模型微调方法、图像分类方法、介质、设备及产品
样本 预训练模型 分片 数据 微调方法
5
一种海洋多模态数据处理方法、装置、设备及存储介质
多模态数据处理方法 海洋环境数据 深度学习算法 高维特征向量 多源数据采集系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号