一种采用声学单位的汉语方言口音矫正方法和系统

正文

推荐专利

申请号：CN202411013205

申请日期：2024-07-26

公开号：CN119049507B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种采用声学单位的汉语方言口音矫正方法和系统。主要步骤包括：首先通过声学单位构造模块分别生成普通话音频和口音音频对应的声学单位序列；再通过语音转文本模块将普通话音频和口音音频分别转录为文本，获得对应的汉字序列；然后通过时间对齐模块对普通话以及口音的汉字序列与声学单位序列进行对齐后，获得对应的汉字序列和声学单位序列以及时间戳信息；接着通过文本对齐模块将以上序列对齐后进行对比，确定音频中具体需要修改的位置；最后利用语音编辑与矫正模块将口音音频转换为口音转普通话音频。本发明可以在说话人发出不属于汉语音素的错误发音的情况下，更加准确的对口音进行矫正。

技术关键词

音频矫正方法序列汉字对齐模块语义向量长度调节器文本语音编辑聚类矫正系统解码器声码器转化器计算机设备动态地存储器

系统为您推荐了相关专利信息

融合歌声情绪的虚拟形象表情控制方法、装置及设备

表情控制方法局部特征信息语义向量音频时间域

一种网络交易违法行为预测方法、电子设备及存储介质

矩阵前馈神经网络变量输出特征全局特征提取

基于遥感条件信息扩散的海洋时空数据插补方法

空间特征提取数据插补方法特征提取模块原始观测数据注意力

基于自适应分组和特征图信息熵的视频关键帧提取方法

信息熵关键帧视频帧序列图像

一种基于图神经网络与卷积神经网络的药物反应预测方法

药物细胞系矩阵二维卷积神经网络多层感知机

一种采用声学单位的汉语方言口音矫正方法和系统

站点导航

APP 下载