摘要
本申请提供了一种基于语音识别的智能通话速记方法、系统和介质。该方法包括:通过获取实时通话的语音信号进行预处理获得优化语音信号并进行语音分帧获得语音帧,再进行语音特征提取,获得实时声纹特征向量和实时语音特征向量并进行处理,获得通话人员身份标签数据及对应的优化语音识别数据,获取语音识别评测数据并进行处理,获得语音识别效准评测指数,最后与预设语音识别效准度阈值进行阈值对比,根据阈值对比结果确定语音识别状态;本申请通过优化语音信号、优化语音识别数据和语音识别效准评测指数的计算与阈值对比,实现了实时通话语音识别和速记的智能性与准确性。
技术关键词
优化语音信号
速记方法
语音识别评测
实时语音
语音特征提取
感知线性预测
语音信号提取
数据
速记系统
指数
背景噪声特征
梅尔频率倒谱系数
噪声强度
分帧方法
身份
标签
噪声抑制
参数
系统为您推荐了相关专利信息
心力衰竭患者
语音特征提取
机器学习模型
B型钠尿肽
队列
电话应答系统
音频
紧急求助电话
实时语音
语音识别模块
电子病历
门诊病历
语音采集模块
主控模块
医生工作站
自然语音
识别系统
特征提取模块
数据采集器
矩阵
筛查系统
刺激呈现系统
语音特征提取
脑电分析模块
数据综合管理系统