语音合成方法及装置

AITNT
正文
推荐专利
语音合成方法及装置
申请号:CN202510764438
申请日期:2025-06-09
公开号:CN120526754A
公开日期:2025-08-22
类型:发明专利
摘要
本说明书实施例提供一种语音合成方法,包括:获取长参考音频和对应的参考文本。将长参考音频和参考文本输入语音合成系统进行目标处理,该语音合成系统包括,对齐模块和编码模块。上述目标处理包括:利用对齐模块,将长参考音频和参考文本在时间维度上对齐,得到参考文本对应的第一音素序列中各参考音素对应的音频片段。利用编码模块,基于各参考音素及其对应的音频片段,确定预设的词表中各个音素对应的各发音表征。从各个音素对应的各发音表征中,确定出目标文本对应的第二音素序列中各目标音素对应的各目标发音表征。基于各目标音素对应的各目标发音表征,确定目标文本对应的目标音频。
技术关键词
文本 发音 音频 对齐模块 编码模块 语音 序列 声码器 扩展算法 处理单元 编解码器 网络 计算机 可读存储介质 存储器 处理器 场景
系统为您推荐了相关专利信息
1
图像编码方法、装置、存储介质及电子设备
切片 水印 像素 图像编码器 图像块
2
一种非结构化数据的检索方法、装置、设备及可读介质
数据检索系统 网关 检索方法 存储库 循环神经网络模型
3
基于人工智能的快速绘画猜词系统
图像生成单元 特征提取单元 游戏个性化 控制模块 记录单元
4
显示方法、装置及程序产品
三维建筑模型 显示信息 地图界面 兴趣点 三维建筑物模型
5
检测方法、装置及系统
对象 工位 图像获取单元 员工 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号