摘要
本发明公开了基于偏误字典和序列对齐的中文口音偏误评估方法与系统,涉及文本分析技术领域,方法包括如下步骤:采集评估对象朗读标准音素文本的语音信号,识别生成待评估音素文本;对比待评估音素文本和标准音素文本,构建口音偏误字典;基于口音偏误字典计算待评估音素文本和标准音素文本的编辑距离;基于编辑距离评估该评估对象的口音偏误。本发明构建了一个详尽的口音偏误字典,在此基础上利用Levenshtein序列对齐算法进行待评估文本与标准文本的编辑距离计算,再基于字典统计字典偏误编辑距离以及其它错误编辑距离;通过对这两个距离进行加权向量得到了一个综合的偏误量化得分,该得分能够更准确地反映学习者的口音偏误程度。
技术关键词
字典
编辑
序列
文本分析技术
对象
语音采集模块
矩阵
发音
代表
元素
评估系统
索引
数据
算法
信号
频率
模式
系统为您推荐了相关专利信息
活体检测方法
文本
活体检测装置
关键点
输入模块
智能监测方法
大数据
机器学习算法
调压柜设备
故障预警机制
自动灭火方法
温感探测器
图像探测器
自动灭火系统
消防炮系统