语音合成模型的训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510076258

申请日期：2025-01-15

公开号：CN119889282A

公开日期：2025-04-25

类型：发明专利

摘要

本申请实施例提供了一种语音合成模型的训练方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：获取文本样本的音素序列，以及文本样本的语音的真实声学特征；将音素序列和真实声学特征输入至改进TTS声学模型进行训练；通过OT‑CFM机制，引导常微分方程对音素序列进行声学特征生成处理，得到与文本样本的期望声学特征对齐的预测声学特征；根据对齐的预测声学特征和真实声学特征，对改进TTS声学模型进行参数更新，得到训练好的语音合成模型，训练好的语音合成模型用于合成文本的语音。本申请实施例能够降低训练难度和训练成本，提供具有更快合成速度、更高合成效果的语音合成模型，以提高合成的语音的质量。

技术关键词

声学特征语音文本样本序列解码器参数更新模块计算机设备模型训练模块机制可读存储介质人工智能技术数据获取模块对齐模块训练装置处理器存储器编码器

系统为您推荐了相关专利信息

一种基于大模型的异常事件检测方法、系统、电子设备及介质

异常事件三元组依存句法分析文本实体

孤独症多源异构大数据的知识图谱的构建方法

多源异构大数据三元组多源异构数据源实体电子病历系统

一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法

性能检测方法畸变校正算法多模态匈牙利算法异常数据处理

一种基于不平衡最优传输的肝脏局灶性病变影像分析方法

影像分析方法肝脏图像嵌入网络模块样本

大气污染调控模型的训练方法、装置及预测方法、装置

调控模型污染物特征生成训练样本信息预测方法数据

语音合成模型的训练方法、装置、设备及存储介质

站点导航

APP 下载