摘要
本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。
技术关键词
语音
发音
序列
样本
表达式
三元组
元学习策略
动态规划算法
梯度下降算法
音频
计算机终端
文本
处理器
波形
重构
语义
参数
可读存储介质
存储器
解码器
系统为您推荐了相关专利信息
语义特征
重构误差
深度学习模型
深度学习图像
编码器
短时傅里叶变换
信号
非线性回声消除
语音功率谱
维纳滤波器
动力学模型建立方法
甲烷水合物
高压反应釜
恒温水浴装置
数据收集系统
噪声标签
医学图像识别系统
噪声样本
噪声鲁棒
数据采样单元