面向VQTTS模型的语音合成缺陷修正方法、设备及存储介质

正文

推荐专利

申请号：CN202510069537

申请日期：2025-01-16

公开号：CN120032621B

公开日期：2025-12-05

类型：发明专利

摘要

本申请涉及语音合成技术领域，尤其涉及一种面向VQTTS模型的语音合成缺陷修正方法、设备及存储介质，包括获取合成文本，定位合成缺陷位置的文本为缺陷短语T；使用大语言模型生成M个包含缺陷短语T的文本W；利用VQTTS对文本W进行语音合成，若是判断合成语音不存在缺陷，截取片段并添加至集合K中；将(T,K)配对添加至系统数据集中；获取待合成的输入文本W，生成M个长度为K的Oracle向量；若缺陷短语T是输入文本W的子字符串，更新Oracle向量；使用VQTTS和Beam Search算法生成修正后的韵律标签序列；选择最佳离散韵律标签序列并生成语音。本申请能够在不更新模型的前提下修正合成缺陷，解决语音合成缺陷修复的技术问题。

技术关键词

缺陷修正方法文本大语言模型标签生成语音序列声学特征加载系统数据算法程序处理器可读存储介质存储器矩阵电子设备波形计算机参数

系统为您推荐了相关专利信息

一种APT恶意软件组织识别方法及系统

决策树模型生成特征向量识别方法指令组织

图像局部编辑方法、装置、设备及介质

注意力编辑方法图像获取单元局部编辑装置卷积神经网络框架

一种工作流构建方法、装置、电子设备及存储介质

工作流标识指令数据客户端

基于人工智能的文本生成方法、装置、设备及存储介质

图像特征向量文本生成模型文本生成方法特征提取模块输出模块

面向区域地表要素遥感提取的域迁移方法、装置、设备及介质

影像地物要素样本嵌入特征教师

面向VQTTS模型的语音合成缺陷修正方法、设备及存储介质

站点导航

APP 下载