一种基于时频域动态特征矩阵的说话人识别方法和系统

正文

推荐专利

申请号：CN202510118255

申请日期：2025-01-24

公开号：CN119943058B

公开日期：2025-11-11

类型：发明专利

摘要

本申请提出了一种基于时频域动态特征矩阵的说话人识别方法和系统，将原始语音的时间动态特征序列映射为二维图像并通过相似性矩阵计算相似度，采用自适应加权方法增强时间动态特征序列中的时域动态特征；对原始语音进行短时傅里叶变换得到频谱值并计算频域动态特征，对相似性阈值进行动态调整；在卷积神经网络模型CNN中进行训练，通过传统方式提取声学特征得到原始语音的初始说话人特征；特征融合分类器根据全连接层的加权自适应融合的特征向量计算说话人的类别概率分布，将概率最大的类别作为最终的结果。本申请提高了复杂场景中说话人识别的准确性和鲁棒性，增强了对不同语音场景的适应能力，更好地保留了语音信号中识别说话人身份的信息。

技术关键词

动态说话人识别方法语音融合分类器矩阵短时傅里叶变换特征提取方式加权方法声学特征说话人识别系统识别说话人卷积神经网络模型序列信号计算机程序产品识别模块图像鲁棒性

系统为您推荐了相关专利信息

一种实现视频切换零延迟的优化方法

广告卡尔曼滤波图形处理单元逻辑深度学习预测

基于动态规划的自动驾驶矿车倒车入位方法、装置和设备

入位方法矿车动态规划算法栅格地图车载设备

一种基于感知物理信息深度强化学习的锂离子电池多状态估计方法

深度强化学习多状态估计方法锂离子电池数据验证方法

一种多模态网络流量分类方法、装置和存储介质

网络流量分类方法动态多模态序列训练样本集

面向高阶结构相似性和标签相关性的跨模态哈希学习方法

哈希学习方法迭代优化算法标签样本拉格朗日乘子法

一种基于时频域动态特征矩阵的说话人识别方法和系统

站点导航

APP 下载