基于音素对比能量学习的方言语音合成方法、终端及介质

正文

推荐专利

申请号：CN202511316462

申请日期：2025-09-16

公开号：CN120833778B

公开日期：2025-12-12

类型：发明专利

摘要

本发明涉及语音合成技术领域，公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本，并将其转换为标准语言音素序列；基于方言的音频样本构建方言音素集合；然后利用训练完成的音素对比能量模型，分别计算每个标准语言音素与各方言音素之间的能量差异，并为每个标准语言音素选取能量差距最小的方言音素作为映射结果；再根据映射结果生成与标准语言音素序列长度一致的方言音素序列；最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度，基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。

技术关键词

语音发音序列样本表达式三元组元学习策略动态规划算法梯度下降算法音频计算机终端文本处理器波形重构语义参数可读存储介质存储器解码器

系统为您推荐了相关专利信息

一种用于动态性能监测的转向架数字孪生模型构建方法

数字孪生模型转向架部件结构二次误差测度转向架结构性能监测数据

一种基于学者学术背景和用户标签的智能推荐方法及系统

智能推荐方法多模态特征融合标签时间序列特征文本

一种基于自然语言问答的层次表格数据可视化智能构建方法、装置、计算机可读存储介质以及电子设备

自然语言问答 Word2Vec模型表格智能构建方法数据可视化

多因素驱动的地下洞室施工中多源有害气体浓度预测方法

有害气体浓度预测地下洞室施工有害气体浓度监测施工现场数据有害气体监测

一种基于交互的物品查找方法、系统、电子设备及介质

物品查找方法异常物品三维地图数据物品位置信息语音特征数据

基于音素对比能量学习的方言语音合成方法、终端及介质

站点导航

APP 下载