摘要
本发明涉及语音识别技术领域,尤其涉及一种说话人识别方法、装置、电子设备及存储介质,该方法包括:获取待识别说话人的目标语音信号;基于目标语音信号在各音频分量上的复数幅值,提取语音特征;将语音特征中各特征点的特征值转换为颜色数值,得到目标语音特征图;基于待识别说话人的目标语音特征图与预先建立的识别库中各预设说话人对应的预设语音特征图之间的相似度,确定目标语音信号对应的目标说话人。本申请提高了识别依据的可解释性,直观展示不同说话人之间的特征差异。
技术关键词
语音特征
非线性相位
说话人识别方法
说话人识别装置
音频
特征值
机器可读指令
强度
特征点
颜色
信号
文本
电子设备
语音识别技术
关系
处理器
可读存储介质
数值
系统为您推荐了相关专利信息
视频生成方法
多模态
视频图像特征
文本
视频生成装置
情感类别
情感特征
音频特征
视频生成方法
融合特征
智能化楼宇
红外线感应器
扬声器模块
防盗系统
压力检测模块