摘要
本发明公开了一种语音口误处理方法、装置、计算机设备及可读存储介质,包括:首先获取待处理的语音数据,然后调用经过训练的端对端语音口误检测模型,该模型基于预训练模型进行优化。将待处理语音数据输入此模型,可准确识别并输出其中的语音口误信息。随后,系统对口误信息进行自动修正,生成无口误的语音数据,从而显著提升语音识别的准确率和用户体验。此方法具有自动化程度高、泛化能力强等优点。
技术关键词
语言模型概率
文本
数据
计算机设备
加权损失函数
样本
语音特征
可读存储介质
多头注意力机制
预训练模型
模块
序列
指令
处理器
滤波器
存储器