康巴藏语语音合成前端建模方法、系统、设备、介质和程序产品

AITNT
正文
推荐专利
康巴藏语语音合成前端建模方法、系统、设备、介质和程序产品
申请号:CN202510728010
申请日期:2025-06-03
公开号:CN120877709A
公开日期:2025-10-31
类型:发明专利
摘要
本申请提供了一种康巴藏语语音合成前端建模方法,可以应用于人工智能技术领域。该康巴藏语语音合成前端建模方法包括:获取康巴藏语文本及其对应的真实藏语韵律标签;基于预设康巴国际音标转写规则对所述康巴藏语文本进行转写,以确定康巴藏文音素向量;基于所述康巴藏文音素向量和层次敏感的局部自注意力机制的三层结构建模韵律信息,以生成预测韵律标签;以及根据所述真实藏语韵律标签和所述预测韵律标签对韵律建模模块进行优化,以得到目标韵律编码器。本申请还提供了一种康巴藏语语音合成前端建模系统、设备、存储介质和程序产品。
技术关键词
韵律特征 嵌入特征 语音 标签 编码器 注意力机制 建模方法 文本 矩阵 多层感知机 建模系统 输出模块 序列 条件随机场 归一化模块 波形 人工智能技术 指令 计算机程序产品
系统为您推荐了相关专利信息
1
基于多级人工智能的动态人员分组信息推荐方法及系统
信息推荐方法 人工智能网络 随机森林 模糊匹配算法 数据
2
用于个体化虚拟腹腔镜系统的人体肝脏形变参数预测模型的构建方法
生物力学参数 肝脏 动物 仿真模型 图像
3
基于渐进式迁移学习网络的机械故障智能诊断方法
机械故障智能诊断方法 特征映射神经网络 样本 分类器 特征提取器
4
基于分数扩散模型的有限角CBCT重建方法及装置
编码器模块 二维离散小波变换 解码器 滤波反投影算法 蒸馏系统
5
个体化用药血药浓度预测算法的辅助生成方法及系统
辅助生成方法 蒸馏 因子 参数 编码向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号