基于声纹特征筛选的语音处理方法、装置、设备及介质

正文

推荐专利

申请号：CN202510844778

申请日期：2025-06-23

公开号：CN120526776B

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技、医疗健康及语音导航等业务场景中，公开了一种基于声纹特征筛选的语音处理方法、装置、设备及介质，包括：通过能量阈值检测静音区间、识别人声片段并剔除非人声成分，基于声纹相似度和信号强度筛选近场主说话人语音，执行时长过滤和置信度验证，动态构建声纹特征库，基于声纹特征库生成声纹掩码矩阵，并对待处理语音信号进行频段抑制，输出提纯语音信号。本发明通过动态构建声纹库，并基于声纹特征库生成声纹掩码矩阵，对待处理语音信号进行频段抑制，有效屏蔽非目标声纹，提升语音信号质量，从而实现高噪声环境下的目标语音精准捕获。

技术关键词

声纹特征掩码矩阵语音处理程序人声置信度阈值语音识别置信度初始聚类中心支持向量机分类短时傅里叶变换参数频段信号梅尔频率倒谱系数密度峰值聚类标记高噪声环境提纯

系统为您推荐了相关专利信息

一种用于测试隐匿性肝性脑病的深度强化学习方法和筛查系统

深度强化学习方法肝性脑病置信度阈值筛查系统深度Q网络学习

一种融合脑区动态路由与频空语义的言语想象解码方法

解码方法融合特征标记特征多头注意力机制网络单元

语音合成方法和装置

语音音频文本声纹特征矩阵

一种基于人工智能的目标检测方法以及装置

高斯金字塔图像像素点数据卷积模型

基于人工智能的用户意图分析系统及方法

节点分析系统意图识别资源分配模块时序

基于声纹特征筛选的语音处理方法、装置、设备及介质

站点导航

APP 下载