摘要
本发明通过构建覆盖多地域、多维度变量的中式方言英语语音语料库,深入剖析汉语方言音素迁移对语音参数差异的影响,开创性地将Fujisaki模型、汉语拼音音位理论与隐马尔可夫模型(HMM)进行融合,实现中式方言英语的高精度自动化语音识别(ASR)、高自然度语音合成(TTS)及智能化发音校正。本发明适用于国内英语教育、跨地区多语言交互及智能语音助手等应用领域,有效解决传统系统在处理中式方言英语时存在的识别率低、合成语音与实际口音脱节等问题。
技术关键词
英语
隐马尔可夫模型
汉语拼音知识
发音
自动化语音识别
高自然度语音
参数
模型压缩
Softmax函数
智能语音助手
语音语料库
识别模块
纠错
声学特征
因子
音频接口
矩阵
集成模块