摘要
本申请提供了一种康巴藏语语音合成前端建模方法,可以应用于人工智能技术领域。该康巴藏语语音合成前端建模方法包括:获取康巴藏语文本及其对应的真实藏语韵律标签;基于预设康巴国际音标转写规则对所述康巴藏语文本进行转写,以确定康巴藏文音素向量;基于所述康巴藏文音素向量和层次敏感的局部自注意力机制的三层结构建模韵律信息,以生成预测韵律标签;以及根据所述真实藏语韵律标签和所述预测韵律标签对韵律建模模块进行优化,以得到目标韵律编码器。本申请还提供了一种康巴藏语语音合成前端建模系统、设备、存储介质和程序产品。
技术关键词
韵律特征
嵌入特征
语音
标签
编码器
注意力机制
建模方法
文本
矩阵
多层感知机
建模系统
输出模块
序列
条件随机场
归一化模块
波形
人工智能技术
指令
计算机程序产品
系统为您推荐了相关专利信息
信息推荐方法
人工智能网络
随机森林
模糊匹配算法
数据
机械故障智能诊断方法
特征映射神经网络
样本
分类器
特征提取器
编码器模块
二维离散小波变换
解码器
滤波反投影算法
蒸馏系统