摘要
本发明提供一种基于人工智能的外语发音纠正方法及系统,属于发音纠正领域,获取外语发音音频及标准音素序列,建立声学模型、音素混淆代价矩阵和时长高斯分布模型,通过强制对齐将音素与音频段匹配,计算对齐声学似然度,对每个音素段采用改进Viterbi算法计算加权自由解码似然度,二者综合得初始发音质量得分,提取实际时长并基于时长高斯分布模型计算偏离惩罚值,修正初始得分得最后的发音质量得分,依据各音素得分及自由解码最优路径定位发音错误点。本发明提升了外语发音评估的全面性和可靠性,为学习者提供了准确详细的发音纠正反馈。
技术关键词
高斯分布模型
解码
发音纠正方法
汉明距离
发音方法
发音纠正系统
序列
矩阵
文本
音频
算法
诊断模块
波束
数据
定义
指数
数值
系统为您推荐了相关专利信息
医学图像分割方法
医学图像分割模型
医学图像数据集
注意力
图像分割技术
车辆轨迹预测方法
车辆历史轨迹
时序特征
特征提取模型
交互特征
多源图像融合
输出特征
多尺度特征提取
可见光图像
归一化模块