摘要
本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。
技术关键词
语音
发音
序列
样本
表达式
三元组
元学习策略
动态规划算法
梯度下降算法
音频
计算机终端
文本
处理器
波形
重构
语义
参数
可读存储介质
存储器
解码器
系统为您推荐了相关专利信息
数字孪生模型
转向架部件结构
二次误差测度
转向架结构
性能监测数据
智能推荐方法
多模态特征融合
标签
时间序列特征
文本
自然语言问答
Word2Vec模型
表格
智能构建方法
数据可视化
有害气体浓度预测
地下洞室施工
有害气体浓度监测
施工现场数据
有害气体监测
物品查找方法
异常物品
三维地图数据
物品位置信息
语音特征数据