一种流式说话人日志方法及系统

AITNT
正文
推荐专利
一种流式说话人日志方法及系统
申请号:CN202411839546
申请日期:2024-12-13
公开号:CN119673173A
公开日期:2025-03-21
类型:发明专利
摘要
本发明涉及一种流式说话人日志方法及系统,该方法包括:获取语音流,使用VAD算法检测语音流中的说话人语音;对所述说话人语音进行切片,基于切片语音进行说话人跳变检测,得到说话人跳变点;对说话人跳变点之前的切片语音流进行拼接,提取拼接后语音段的声纹特征,将提取的声纹特征在预先建立的临时声纹库中进行声纹特征比对,比对成功后确定声纹特征对应的说话人类别。本发明采用流式处理方式,能够实时处理和分析连续的语音流,无需等待整个语音文件处理完毕,从提高了处理效率和实时性。本发明不需要提前预设说话人数量,而是在执行过程中逐步注册声纹,通过临时声纹库发现新的说话人,实现了对说话人数量的无限制处理。
技术关键词
声纹特征 日志方法 VAD算法 切片 语音特征 线性预测倒谱系数 梅尔倒谱系数 声纹模型 矩阵 日志系统 存储器 程序 处理器 可读存储介质 模块 计算机 电子设备 指令 身份
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号