文本转换语音方法、装置、设备及介质

正文

推荐专利

文本转换语音方法、装置、设备及介质

申请号：CN202510441902

申请日期：2025-04-09

公开号：CN120220645A

公开日期：2025-06-27

类型：发明专利

摘要

本发明涉及语言信号处理领域、金融科技领域以及医疗健康领域，公开了一种文本转换语音方法、装置、设备及介质，包括：对目标文本进行文本分词处理以及词性标注处理，得到预处理文本，利用预设的双自回归架构根据预处理文本生成输出编码，利用解码器根据输出编码生成梅尔频谱，利用编码架构对梅尔频谱进行量化重构处理，得到量化张量，计算量化张量与梅尔频谱的张量损失值，基于反向传播算法根据张量损失值优化编码器架构的参数，基于优化后的编码架构根据预先获取的待处理文本生成提示编码，结合提示编码以及待处理文本生成待处理梅尔频谱，利用预设的声码器根据待处理梅尔频谱生成目标音频。提高了文本转音频的效率这准确度。

技术关键词

语音方法文本线性变换矩阵编码器架构前馈神经网络传播算法音频频谱特征声码器短时傅里叶变换解码器可读存储介质分词语音装置医疗健康通道处理器重构模块

系统为您推荐了相关专利信息

设备故障分析方法、装置、计算机设备和可读存储介质

图谱设备故障分析方法节点关系图标

基于语言模型的运价数据智能解析方法、装置及存储介质

国际运价数据智能解析方法搜索工具解析器语义

产品全生命周期多模态工业知识软件化方法

产品全生命周期多模态工业知识图谱知识本体三元组

一种基于持续学习的公文格式与语义双重校验方法

校验方法文本格式化语义校验算法

一种基于大语言模型和本地知识库的数据模型建立方法

数据模型建立方法大语言模型专业术语编码分布式爬虫技术平行语料库

文本转换语音方法、装置、设备及介质

站点导航

APP 下载