一种采用声学单位的汉语方言口音矫正方法和系统

AITNT
正文
推荐专利
一种采用声学单位的汉语方言口音矫正方法和系统
申请号:CN202411013205
申请日期:2024-07-26
公开号:CN119049507B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种采用声学单位的汉语方言口音矫正方法和系统。主要步骤包括:首先通过声学单位构造模块分别生成普通话音频和口音音频对应的声学单位序列;再通过语音转文本模块将普通话音频和口音音频分别转录为文本,获得对应的汉字序列;然后通过时间对齐模块对普通话以及口音的汉字序列与声学单位序列进行对齐后,获得对应的汉字序列和声学单位序列以及时间戳信息;接着通过文本对齐模块将以上序列对齐后进行对比,确定音频中具体需要修改的位置;最后利用语音编辑与矫正模块将口音音频转换为口音转普通话音频。本发明可以在说话人发出不属于汉语音素的错误发音的情况下,更加准确的对口音进行矫正。
技术关键词
音频 矫正方法 序列 汉字 对齐模块 语义向量 长度调节器 文本 语音 编辑 聚类 矫正系统 解码器 声码器 转化器 计算机设备 动态地 存储器
系统为您推荐了相关专利信息
1
融合歌声情绪的虚拟形象表情控制方法、装置及设备
表情控制方法 局部特征信息 语义向量 音频 时间域
2
一种网络交易违法行为预测方法、电子设备及存储介质
矩阵 前馈神经网络 变量 输出特征 全局特征提取
3
基于遥感条件信息扩散的海洋时空数据插补方法
空间特征提取 数据插补方法 特征提取模块 原始观测数据 注意力
4
基于自适应分组和特征图信息熵的视频关键帧提取方法
信息熵 关键帧 视频帧 序列 图像
5
一种基于图神经网络与卷积神经网络的药物反应预测方法
药物 细胞系 矩阵 二维卷积神经网络 多层感知机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号