摘要
本发明公开了一种采用声学单位的汉语方言口音矫正方法和系统。主要步骤包括:首先通过声学单位构造模块分别生成普通话音频和口音音频对应的声学单位序列;再通过语音转文本模块将普通话音频和口音音频分别转录为文本,获得对应的汉字序列;然后通过时间对齐模块对普通话以及口音的汉字序列与声学单位序列进行对齐后,获得对应的汉字序列和声学单位序列以及时间戳信息;接着通过文本对齐模块将以上序列对齐后进行对比,确定音频中具体需要修改的位置;最后利用语音编辑与矫正模块将口音音频转换为口音转普通话音频。本发明可以在说话人发出不属于汉语音素的错误发音的情况下,更加准确的对口音进行矫正。
技术关键词
音频
矫正方法
序列
汉字
对齐模块
语义向量
长度调节器
文本
语音
编辑
聚类
矫正系统
解码器
声码器
转化器
计算机设备
动态地
存储器
系统为您推荐了相关专利信息
表情控制方法
局部特征信息
语义向量
音频
时间域
空间特征提取
数据插补方法
特征提取模块
原始观测数据
注意力