基于声纹特征筛选的语音处理方法、装置、设备及介质

AITNT
正文
推荐专利
基于声纹特征筛选的语音处理方法、装置、设备及介质
申请号:CN202510844778
申请日期:2025-06-23
公开号:CN120526776B
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及语音处理技术领域,可应用于金融科技、医疗健康及语音导航等业务场景中,公开了一种基于声纹特征筛选的语音处理方法、装置、设备及介质,包括:通过能量阈值检测静音区间、识别人声片段并剔除非人声成分,基于声纹相似度和信号强度筛选近场主说话人语音,执行时长过滤和置信度验证,动态构建声纹特征库,基于声纹特征库生成声纹掩码矩阵,并对待处理语音信号进行频段抑制,输出提纯语音信号。本发明通过动态构建声纹库,并基于声纹特征库生成声纹掩码矩阵,对待处理语音信号进行频段抑制,有效屏蔽非目标声纹,提升语音信号质量,从而实现高噪声环境下的目标语音精准捕获。
技术关键词
声纹特征 掩码矩阵 语音处理程序 人声 置信度阈值 语音识别置信度 初始聚类中心 支持向量机分类 短时傅里叶变换 参数 频段 信号 梅尔频率倒谱系数 密度峰值聚类 标记 高噪声环境 提纯
系统为您推荐了相关专利信息
1
一种用于测试隐匿性肝性脑病的深度强化学习方法和筛查系统
深度强化学习方法 肝性脑病 置信度阈值 筛查系统 深度Q网络学习
2
一种融合脑区动态路由与频空语义的言语想象解码方法
解码方法 融合特征 标记特征 多头注意力机制 网络单元
3
语音合成方法和装置
语音 音频 文本 声纹特征 矩阵
4
一种基于人工智能的目标检测方法以及装置
高斯金字塔 图像 像素点 数据 卷积模型
5
基于人工智能的用户意图分析系统及方法
节点 分析系统 意图识别 资源分配模块 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号