语音合成方法、装置、存储介质及电子设备

AITNT
正文
推荐专利
语音合成方法、装置、存储介质及电子设备
申请号:CN202410979840
申请日期:2024-07-22
公开号:CN118824224A
公开日期:2024-10-22
类型:发明专利
摘要
本申请公开了一种语音合成方法、装置、存储介质及电子设备,涉及人工智能技术领域,包括:首先获取待语音合成的目标文本;然后将所述目标文本输入到语音合成模型中,所述语音合成模型采用VITS模型架构作为基础架构,并采用Duration Predictor替换所述VITS模型架构中的对齐结构,所述语音合成模型包括Pitch Decoder;再利用所述Duration Predictor,获取所述目标文本对应的音素的目标时长,以及利用所述Pitch Decoder,获取所述音素的目标基频;最后根据所述目标时长和所述目标基频合成所述目标文本对应的目标语音,作为所述语音合成模型的输出结果。本申请的技术方案能够提高语音合成质量,改善文本转语音的效果。
技术关键词
样本 语音标签 音频解码器 训练集 计算机程序产品 文本编码器 电子设备 处理器 人工智能技术 变量 指标 生成方法 输入模块 可读存储介质 参数
系统为您推荐了相关专利信息
1
一种工业流程剩余时间预测方法、装置及存储介质
序列 轨迹 工业 注意力机制 语义
2
基于物理信息驱动的近β钛合金多性能预测方法
多性能预测方法 近β钛合金 XGBoost模型 物理特征参数 机器学习模型
3
一种基于双路径训练的无监督多模态图像配准方法及系统
多模态图像数据 表达式 图像配准系统 上采样 图像像素
4
一种用于计算中心的制冷系统能耗优化方法、系统及介质
计算中心 能耗优化方法 配置制冷系统 因子 主机
5
一种基于近端对抗约束策略搜索的离线强化学习方法
强化学习方法 离线 随机梯度下降 策略更新 损失函数设计
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号