一种可定制化的语音合成方法、装置及电子设备

正文

推荐专利

申请号：CN202411381578

申请日期：2024-09-30

公开号：CN119517003A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种可定制化的语音合成方法、装置及电子设备，方法包括：生成训练文本集、测试文本集、以及训练文本集对应的克隆语音；对所生成的克隆语音进行过滤并获取识别文本，根据真实训练文本对识别文本进行再过滤，得到训练集；使用训练集训练语音合成模型，利用语音合成模型生成测试文本集的语音，统计该语音的错误率及错误音素；生成含有错误音素的增强训练文本集以获得增强训练集，使用增强训练集对语音合成模型进行微调，直到错误率降低至阈值或稳定状态。通过该方法增强了语音合成模型的稳定性，且通过该方法降低了定制化语音合成模型的数据成本，缩短了模型迭代周期，提升了定制化语音合成的准确率，提高用户体验。

技术关键词

语音识别模型文本情感识别模型声纹识别模型错误率训练集大语言模型模型训练模块电子设备发音存储器处理器度量音频数据曲线周期

系统为您推荐了相关专利信息

基于级别分类和二次相似度匹配的地址标准化及定位方法

地址标准化非标准定位方法语义层级

基于多特征融合的社交文本地理位置推理方法、装置与电子设备

网格文本地理实体推理方法语义特征

基于多模态数据的事件分析方法、装置、设备及介质

事件分析方法智能决策模型生物特征数据多模态数据融合报告

分子生成及模型训练方法、装置、设备及存储介质

文本样本分子编码器解码器

一种基于H.265的抓屏方法及抓屏系统

屏幕内容分析屏幕刷新率动态参数分辨率

一种可定制化的语音合成方法、装置及电子设备

站点导航

APP 下载