一种多英语口音的语音识别方法及系统

正文

推荐专利

一种多英语口音的语音识别方法及系统

申请号：CN202410819623

申请日期：2024-06-24

公开号：CN118782092A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开一种多英语口音的语音识别方法及系统，属于口音识别领域。针对现有英语口音识别精度差且成本高的问题，本发明提供一种多英语口音的语音识别方法，包括采集音频数据；对音频数据进行特征提取，并根据特征计算该音频数据的特征向量值；根据特征向量值判断该音频数据所属的口音类别；根据音频数据所属的口音类别选择对应的预训练模型对音频数据进行语音识别。本发明根据音频的特征向量值确定音频数据所属的口音类别，避免直接根据音频说话人所属地域来划分口音类别所造成的误差；避免使用一种通用模型所带来的识别不准确的问题；整个识别方法实现了便携式低资源计算的英语口音识别，在混合多种英语口音的应用场景下，有效提高识别率。

技术关键词

语音识别方法特征向量值英语音频训练识别模型语音采集模块语音识别系统麦克风阵列信号处理模块数据存储模块识别模块解码场景误差资源精度

系统为您推荐了相关专利信息

一种轨道车运行控制设备自动化综合测试系统及方法

综合测试系统控制设备主机单板综合测试方法信号

一种基于AI扩散模型的智能化数据处理系统及方法

图像特征数据语义数据传输模块数据采集模块跨模态

高频增强公路广播一体机

广播一体机音频编解码音频输出接口网络传输模块功放模块

音频转文本处理方法、装置、设备及存储介质

语音特征信息校验信息信息提取模型计算机执行指令文本处理方法

基于大模型的面向学生的心理疏导方法

心理疏导方法缓冲方法闭环反馈系统文本强度

一种多英语口音的语音识别方法及系统

站点导航

APP 下载