摘要
本发明公开一种多英语口音的语音识别方法及系统,属于口音识别领域。针对现有英语口音识别精度差且成本高的问题,本发明提供一种多英语口音的语音识别方法,包括采集音频数据;对音频数据进行特征提取,并根据特征计算该音频数据的特征向量值;根据特征向量值判断该音频数据所属的口音类别;根据音频数据所属的口音类别选择对应的预训练模型对音频数据进行语音识别。本发明根据音频的特征向量值确定音频数据所属的口音类别,避免直接根据音频说话人所属地域来划分口音类别所造成的误差;避免使用一种通用模型所带来的识别不准确的问题;整个识别方法实现了便携式低资源计算的英语口音识别,在混合多种英语口音的应用场景下,有效提高识别率。
技术关键词
语音识别方法
特征向量值
英语
音频
训练识别模型
语音采集模块
语音识别系统
麦克风阵列
信号处理模块
数据存储模块
识别模块
解码
场景
误差
资源
精度
系统为您推荐了相关专利信息
综合测试系统
控制设备主机
单板
综合测试方法
信号
图像特征数据
语义
数据传输模块
数据采集模块
跨模态
广播一体机
音频编解码
音频输出接口
网络传输模块
功放模块
语音特征信息
校验信息
信息提取模型
计算机执行指令
文本处理方法