一种多国别英语发音数据库构建及自动识别方法

AITNT
正文
推荐专利
一种多国别英语发音数据库构建及自动识别方法
申请号:CN202411473947
申请日期:2024-10-22
公开号:CN119360883A
公开日期:2025-01-24
类型:发明专利
摘要
本发明涉及一种多国别英语发音数据库构建及自动识别方法,通过全球范围内的数据收集,结合预处理、特征提取、数据库构建、模型训练等步骤,创建一个鲁棒的识别方法,利用梅尔频率倒谱系数(MFCC)模型和BERT‑BiGRU模型提取语音和文本特征,并通过编码器‑解码器框架训练深度学习模型,以提高对非标准口音的识别能力。此外,采用灭错算法和鲁棒性优化算法,进一步增强模型的准确性和适应性。最终,通过系统性评估,确保模型在实际应用中能够达到高准确率、召回率和F1分数。
技术关键词
自动识别方法 梅尔频率倒谱系数 自动语音识别技术 英语 文本 语音特征 注意力机制 解码器框架 BERT模型 数据 鲁棒性 发音特征 双编码器 滤波器 训练深度学习模型
系统为您推荐了相关专利信息
1
一种基于自然语言处理的文档级关系抽取方法
关系抽取方法 自然语言 实体 多粒度特征 注意力机制
2
推荐页面生成方法和装置、电子设备及存储介质
页面文本信息 样本 预测点击率 画像 页面生成方法
3
轨道交通表格-文本混合数据的问答方法及装置
问答模型 问答方法 表格 答案 文本
4
自动化生成寄存器验证模型的方法、电子设备和介质
模块 脚本 计算机可执行指令 芯片验证技术 定义
5
一种基于AI的电子文件智能管理方法及系统
递归神经网络 智能管理方法 深度神经网络 多层次特征提取 构建用户画像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号