基于音素对比能量学习的方言语音合成方法、终端及介质

AITNT
正文
推荐专利
基于音素对比能量学习的方言语音合成方法、终端及介质
申请号:CN202511316462
申请日期:2025-09-16
公开号:CN120833778B
公开日期:2025-12-12
类型:发明专利
摘要
本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。
技术关键词
语音 发音 序列 样本 表达式 三元组 元学习策略 动态规划算法 梯度下降算法 音频 计算机终端 文本 处理器 波形 重构 语义 参数 可读存储介质 存储器 解码器
系统为您推荐了相关专利信息
1
一种一般冗余并联机器人正解方法
并联机器人 正解方法 坐标系 牛顿迭代法 冗余
2
基于特征重构的图像OOD检测方法研究
语义特征 重构误差 深度学习模型 深度学习图像 编码器
3
一种消除对讲系统回声方法
短时傅里叶变换 信号 非线性回声消除 语音功率谱 维纳滤波器
4
一种水合物分解动力学模型建立方法
动力学模型建立方法 甲烷水合物 高压反应釜 恒温水浴装置 数据收集系统
5
一种基于标签噪声鲁棒学习的医学图像识别系统
噪声标签 医学图像识别系统 噪声样本 噪声鲁棒 数据采样单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号