一种多英语口音的语音识别方法及系统

AITNT
正文
推荐专利
一种多英语口音的语音识别方法及系统
申请号:CN202410819623
申请日期:2024-06-24
公开号:CN118782092A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开一种多英语口音的语音识别方法及系统,属于口音识别领域。针对现有英语口音识别精度差且成本高的问题,本发明提供一种多英语口音的语音识别方法,包括采集音频数据;对音频数据进行特征提取,并根据特征计算该音频数据的特征向量值;根据特征向量值判断该音频数据所属的口音类别;根据音频数据所属的口音类别选择对应的预训练模型对音频数据进行语音识别。本发明根据音频的特征向量值确定音频数据所属的口音类别,避免直接根据音频说话人所属地域来划分口音类别所造成的误差;避免使用一种通用模型所带来的识别不准确的问题;整个识别方法实现了便携式低资源计算的英语口音识别,在混合多种英语口音的应用场景下,有效提高识别率。
技术关键词
语音识别方法 特征向量值 英语 音频 训练识别模型 语音采集模块 语音识别系统 麦克风阵列 信号处理模块 数据存储模块 识别模块 解码 场景 误差 资源 精度
系统为您推荐了相关专利信息
1
一种轨道车运行控制设备自动化综合测试系统及方法
综合测试系统 控制设备主机 单板 综合测试方法 信号
2
一种基于AI扩散模型的智能化数据处理系统及方法
图像特征数据 语义 数据传输模块 数据采集模块 跨模态
3
高频增强公路广播一体机
广播一体机 音频编解码 音频输出接口 网络传输模块 功放模块
4
音频转文本处理方法、装置、设备及存储介质
语音特征信息 校验信息 信息提取模型 计算机执行指令 文本处理方法
5
基于大模型的面向学生的心理疏导方法
心理疏导方法 缓冲方法 闭环反馈系统 文本 强度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号