一种流式说话人日志方法及系统

正文

推荐专利

一种流式说话人日志方法及系统

申请号：CN202411839546

申请日期：2024-12-13

公开号：CN119673173A

公开日期：2025-03-21

类型：发明专利

摘要

本发明涉及一种流式说话人日志方法及系统，该方法包括：获取语音流，使用VAD算法检测语音流中的说话人语音；对所述说话人语音进行切片，基于切片语音进行说话人跳变检测，得到说话人跳变点；对说话人跳变点之前的切片语音流进行拼接，提取拼接后语音段的声纹特征，将提取的声纹特征在预先建立的临时声纹库中进行声纹特征比对，比对成功后确定声纹特征对应的说话人类别。本发明采用流式处理方式，能够实时处理和分析连续的语音流，无需等待整个语音文件处理完毕，从提高了处理效率和实时性。本发明不需要提前预设说话人数量，而是在执行过程中逐步注册声纹，通过临时声纹库发现新的说话人，实现了对说话人数量的无限制处理。

技术关键词

声纹特征日志方法 VAD算法切片语音特征线性预测倒谱系数梅尔倒谱系数声纹模型矩阵日志系统存储器程序处理器可读存储介质模块计算机电子设备指令身份

一种流式说话人日志方法及系统

站点导航

APP 下载