模型训练、语音生成方法、装置、设备及介质

AITNT
正文
推荐专利
模型训练、语音生成方法、装置、设备及介质
申请号:CN202410814367
申请日期:2024-06-21
公开号:CN118942447A
公开日期:2024-11-12
类型:发明专利
摘要
本发明公开了模型训练、语音生成方法、装置、设备及介质。方法包括:根据目标文本对应的音素特征表示与目标对象声音的嵌入表示,生成携带有目标对象声音特性的先验音素特征分布参数;将目标对象声音的嵌入表示和先验音素特征分布参数输入到第一模型进行一致性知识蒸馏训练,得到第二模型;其中,第二模型从第一模型学习到生成融合目标对象声音特性预测语音的能力。在训练过程中,将目标对象嵌入输入到不同模型中,从而实现整体提升模型输出的语音信息的自然语言表达能力,使得语言信息能够更加准确的体现出目标对象声音特性。此外,采用知识蒸馏方式训练得到第二模型,从而能够有效提升训练效率以及后续模型应用过程中语音生成效率。
技术关键词
对象 语音生成方法 参数 校正 蒸馏 文本 噪声信息 模型训练装置 模型训练方法 索引 整体提升 样本 编码器 生成装置 程序 轨迹 自然语言
系统为您推荐了相关专利信息
1
考虑负荷和可再生能源不确定性的分时电价计算方法及系统
电价计算方法 分时电价优化 负荷 遗传算法求解 计算机程序代码
2
基于意图识别的视频序列推荐模型的训练方法、装置
意图识别 样本 视频 序列推荐方法 大语言模型
3
基于VMD-LSTM的山区公路边坡位移预测方法、装置和存储介质
山区公路边坡 位移预测方法 LSTM模型 超参数 数据
4
一种工业生产用碳核算量计算方法
实时数据 量计算方法 数据采集频率 流速 监测历史数据
5
图像处理方法、装置、电子设备、存储介质及程序产品
图像处理模型 分类特征 图像处理方法 点云 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号