一种说话人识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510037829

申请日期：2025-01-10

公开号：CN119479657B

公开日期：2025-04-29

类型：发明专利

摘要

本发明涉及语音识别技术领域，尤其涉及一种说话人识别方法、装置、电子设备及存储介质，该方法包括：获取待识别说话人的目标语音信号；基于目标语音信号在各音频分量上的复数幅值，提取语音特征；将语音特征中各特征点的特征值转换为颜色数值，得到目标语音特征图；基于待识别说话人的目标语音特征图与预先建立的识别库中各预设说话人对应的预设语音特征图之间的相似度，确定目标语音信号对应的目标说话人。本申请提高了识别依据的可解释性，直观展示不同说话人之间的特征差异。

技术关键词

语音特征非线性相位说话人识别方法说话人识别装置音频特征值机器可读指令强度特征点颜色信号文本电子设备语音识别技术关系处理器可读存储介质数值

系统为您推荐了相关专利信息

基于多模态输入的视频生成方法、装置及系统

视频生成方法多模态视频图像特征文本视频生成装置

具身技能的创建方法及相关装置

消息云端创建系统多模态控件

基于多模态统一嵌入空间引导的听话人视频生成方法

情感类别情感特征音频特征视频生成方法融合特征

一种智能化楼宇防盗系统

智能化楼宇红外线感应器扬声器模块防盗系统压力检测模块

语音交互方法及装置、设备、存储介质

音频信号车载终端语音交互方法车辆

一种说话人识别方法、装置、电子设备及存储介质

站点导航

APP 下载