基于音素对比能量学习的方言语音合成方法、终端及介质

AITNT
正文
推荐专利
基于音素对比能量学习的方言语音合成方法、终端及介质
申请号:CN202511316462
申请日期:2025-09-16
公开号:CN120833778B
公开日期:2025-12-12
类型:发明专利
摘要
本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。
技术关键词
语音 发音 序列 样本 表达式 三元组 元学习策略 动态规划算法 梯度下降算法 音频 计算机终端 文本 处理器 波形 重构 语义 参数 可读存储介质 存储器 解码器
系统为您推荐了相关专利信息
1
一种用于动态性能监测的转向架数字孪生模型构建方法
数字孪生模型 转向架部件结构 二次误差测度 转向架结构 性能监测数据
2
一种基于学者学术背景和用户标签的智能推荐方法及系统
智能推荐方法 多模态特征融合 标签 时间序列特征 文本
3
一种基于自然语言问答的层次表格数据可视化智能构建方法、装置、计算机可读存储介质以及电子设备
自然语言问答 Word2Vec模型 表格 智能构建方法 数据可视化
4
多因素驱动的地下洞室施工中多源有害气体浓度预测方法
有害气体浓度预测 地下洞室施工 有害气体浓度监测 施工现场数据 有害气体监测
5
一种基于交互的物品查找方法、系统、电子设备及介质
物品查找方法 异常物品 三维地图数据 物品位置信息 语音特征数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号