摘要
本发明公开了一种呼叫中心长语音识别模型训练方法,包括步骤:获取呼叫中心的同一用户的待识别语音数据,待识别语音数据包括不连续短语音与连续长语音,并对其进行预处理;针对预处理后的不连续短语音采用语音拼接算法进行拼接处理后获得拼接长语音A;针对预处理后的连续长语音采用语音切割拼接方法进行处理后获得拼接长语音B;连续长语音与拼接长语音A、拼接长语音B分别进行特征提取得到语义特征向量矩阵;将语义特征向量矩阵输入至预构建的长语音识别模型中进行训练,得到训练好的长语音识别模型。本发明通过综合不连续短语音以及连续长语音来提供长语音判别的依据,具有准确度高且识别速度快的优势。
技术关键词
呼叫中心
识别语音数据
语音识别模型
切割拼接方法
拼接算法
语音特征
语义特征
矩阵
序列
编码器
滤波器
参数
逻辑
噪声
速度
系统为您推荐了相关专利信息
智能测试仪器
接口方法
语音识别交互
文本
专用数据集
电网设备状态
状态机
特征值
重建误差
协方差矩阵
儿童语言能力
大语言模型
蒸馏
自然语言
评估系统