一种多国别英语发音数据库构建及自动识别方法

正文

推荐专利

申请号：CN202411473947

申请日期：2024-10-22

公开号：CN119360883A

公开日期：2025-01-24

类型：发明专利

摘要

本发明涉及一种多国别英语发音数据库构建及自动识别方法，通过全球范围内的数据收集，结合预处理、特征提取、数据库构建、模型训练等步骤，创建一个鲁棒的识别方法，利用梅尔频率倒谱系数(MFCC)模型和BERT‑BiGRU模型提取语音和文本特征，并通过编码器‑解码器框架训练深度学习模型，以提高对非标准口音的识别能力。此外，采用灭错算法和鲁棒性优化算法，进一步增强模型的准确性和适应性。最终，通过系统性评估，确保模型在实际应用中能够达到高准确率、召回率和F1分数。

技术关键词

自动识别方法梅尔频率倒谱系数自动语音识别技术英语文本语音特征注意力机制解码器框架 BERT模型数据鲁棒性发音特征双编码器滤波器训练深度学习模型

系统为您推荐了相关专利信息

一种基于自然语言处理的文档级关系抽取方法

关系抽取方法自然语言实体多粒度特征注意力机制

推荐页面生成方法和装置、电子设备及存储介质

页面文本信息样本预测点击率画像页面生成方法

轨道交通表格-文本混合数据的问答方法及装置

问答模型问答方法表格答案文本

自动化生成寄存器验证模型的方法、电子设备和介质

模块脚本计算机可执行指令芯片验证技术定义

一种基于AI的电子文件智能管理方法及系统

递归神经网络智能管理方法深度神经网络多层次特征提取构建用户画像

一种多国别英语发音数据库构建及自动识别方法

站点导航

APP 下载