摘要
本发明涉及一种流式说话人日志方法及系统,该方法包括:获取语音流,使用VAD算法检测语音流中的说话人语音;对所述说话人语音进行切片,基于切片语音进行说话人跳变检测,得到说话人跳变点;对说话人跳变点之前的切片语音流进行拼接,提取拼接后语音段的声纹特征,将提取的声纹特征在预先建立的临时声纹库中进行声纹特征比对,比对成功后确定声纹特征对应的说话人类别。本发明采用流式处理方式,能够实时处理和分析连续的语音流,无需等待整个语音文件处理完毕,从提高了处理效率和实时性。本发明不需要提前预设说话人数量,而是在执行过程中逐步注册声纹,通过临时声纹库发现新的说话人,实现了对说话人数量的无限制处理。
技术关键词
声纹特征
日志方法
VAD算法
切片
语音特征
线性预测倒谱系数
梅尔倒谱系数
声纹模型
矩阵
日志系统
存储器
程序
处理器
可读存储介质
模块
计算机
电子设备
指令
身份