语音合成方法、装置、设备及介质

正文

推荐专利

语音合成方法、装置、设备及介质

申请号：CN202510921610

申请日期：2025-07-03

公开号：CN120656443A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及语音合成技术领域，可应用于金融科技和医疗健康领域，公开了一种语音合成方法、装置、设备及介质，包括：获取原始语音，并从所述原始语音中提取高维特征得到高维语音特征；将所述高维语言特征输入预训练的矢量量化器进行离散化得到多个离散Token；根据与所述原始语音相对应的文本信息和多个所述离散Token通过TTS生成器生成预测Token序列，其中，所述TTS生成器是采用样本集对大语言模型进行训练和验证得到的；将所述预测Token序列输入语音解码器进行语音合成得到目标语音。提高了合成语音的质量和准确度。

技术关键词

语音特征矢量量化器语音解码器样本大语言模型文本韵律预测序列可读存储介质医疗健康数据处理器计算机设备存储器金融

系统为您推荐了相关专利信息

基于大数据的老年病患病风险预测方法及系统

患病风险预测方法疾病分析单元大数据样本

一种基于人工智能的跨境电商智能选品系统

注意力神经网络编码向量协方差矩阵进化策略跨境电商平台

一种钛合金成分优化设计的方法及钛合金制备的方法

钛合金关系随机森林网格搜索方法原料预处理

一种基于梯度提升树算法的多种驱油体系变循环组合方法

驱油体系组合方法敏感性分析方法梯度提升树模型数值模拟技术

一种小样本材料逆向预测方法

逆向预测方法广义回归神经网络多输入单输出遗传算法样本

语音合成方法、装置、设备及介质

站点导航

APP 下载