一种基于时频域动态特征矩阵的说话人识别方法和系统

AITNT
正文
推荐专利
一种基于时频域动态特征矩阵的说话人识别方法和系统
申请号:CN202510118255
申请日期:2025-01-24
公开号:CN119943058B
公开日期:2025-11-11
类型:发明专利
摘要
本申请提出了一种基于时频域动态特征矩阵的说话人识别方法和系统,将原始语音的时间动态特征序列映射为二维图像并通过相似性矩阵计算相似度,采用自适应加权方法增强时间动态特征序列中的时域动态特征;对原始语音进行短时傅里叶变换得到频谱值并计算频域动态特征,对相似性阈值进行动态调整;在卷积神经网络模型CNN中进行训练,通过传统方式提取声学特征得到原始语音的初始说话人特征;特征融合分类器根据全连接层的加权自适应融合的特征向量计算说话人的类别概率分布,将概率最大的类别作为最终的结果。本申请提高了复杂场景中说话人识别的准确性和鲁棒性,增强了对不同语音场景的适应能力,更好地保留了语音信号中识别说话人身份的信息。
技术关键词
动态 说话人识别方法 语音 融合分类器 矩阵 短时傅里叶变换 特征提取方式 加权方法 声学特征 说话人识别系统 识别说话人 卷积神经网络模型 序列 信号 计算机程序产品 识别模块 图像 鲁棒性
系统为您推荐了相关专利信息
1
一种实现视频切换零延迟的优化方法
广告 卡尔曼滤波 图形处理单元 逻辑 深度学习预测
2
基于动态规划的自动驾驶矿车倒车入位方法、装置和设备
入位方法 矿车 动态规划算法 栅格地图 车载设备
3
一种基于感知物理信息深度强化学习的锂离子电池多状态估计方法
深度强化学习 多状态 估计方法 锂离子电池 数据验证方法
4
一种多模态网络流量分类方法、装置和存储介质
网络流量分类方法 动态 多模态 序列 训练样本集
5
面向高阶结构相似性和标签相关性的跨模态哈希学习方法
哈希学习方法 迭代优化算法 标签 样本 拉格朗日乘子法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号